标签: python pandas pivot-table
我只是按照自己的意愿重塑dataframe。 index是userid,列是subgameID,填充了rating作为值。但是所有的值都会丢失数据。
dataframe
答案 0 :(得分:0)
仅供记录 - 如果您只检查2列,那么为什么不使用pd.crosstab?
pd.crosstab(ratings_data.userID, ratings_data.subgameId, margins=True)
如果您需要pivot_table,请尝试添加参数fillna = 0。
fillna = 0
您也可以尝试在数据的小子样本上执行此操作 - 可能正确引入了NaN(许多userID只属于subgameID的小子集)?