创建虚拟变量可以解决

时间:2017-10-25 17:54:12

标签: python pandas numpy dataframe scikit-learn

我正在尝试使用pd.get_dummies或Serie.get_dummies从列创建虚拟变量,但我收到内存错误的即时错误。 (我有大约100万行)。

该列如下所示:

      Col1
0     A | B
1       A
2     C | A
3     B | C

有没有办法绕过这个错误?使用其他图书馆还是什么?

感谢您的帮助!

1 个答案:

答案 0 :(得分:0)

您可能有兴趣尝试其他方法将变量编码为mentioned here。您还可以查看this repository以了解文章中提到的各种方法的实现。这是documentation for the same

否则,你必须按照@Vivek Kumar在评论中提到的两次通过这样做。

您可以查看thisthisthis,了解有关编码变量的其他方法的详情。