在Python中枢转一张大桌子

时间:2019-08-31 19:30:30

标签: python pandas

我有大型数据集,其中有72000 * 3(行*列)。这是无枢轴的 数据。当我将这些数据转换为数据透视表时,发生了ValueError。

这是我的数据集示例

UserID   MovieID   Ratings  
    35     16107         3  
  4498     16107         4  
  1915     16108         3  
 17615     16108         5  
  1075     16108         3  
  2067     16108         4  
  4808     16109         5  
  4391     16109         3  
  4160     16110         3  
  7543     16110         4  
   119     16111         1  
   119     16112         3  

from sklearn.metrics.pairwise import cosine_similarity 
df1 = pd.read_csv("C:/Users/AA/Desktop/movierating.csv")
print(df1) 
df1 = df1.pivot_table(index='UserID',columns='MovieID',values='Ratings').fillna(0)
print(df1)

提高

ValueError: array is too big; `arr.size * arr.dtype.itemsize` is larger than the maximum possible size.

0 个答案:

没有答案