如何以更好的方式编码?

时间:2019-02-08 12:27:43

标签: python-3.x pandas

我正在尝试对具有200000行和24列的大型csv使用getdummies功能。

我已经将特定的csv转换为pandas数据帧。

列名company_products_services包含字符串值,就像我们在推荐系统(例如genre)中遇到的值一样。

在尝试编码时,出现内存错误。

%%time
test_df=pd.concat([df_200K_1,df_200K_1['company_products_services'].str.get_dummies(sep=',')],axis=1)
test_df.shape

0 个答案:

没有答案