我正在尝试使用pd.get_dummies或Serie.get_dummies从列创建虚拟变量,但我收到内存错误的即时错误。 (我有大约100万行)。
该列如下所示:
Col1
0 A | B
1 A
2 C | A
3 B | C
有没有办法绕过这个错误?使用其他图书馆还是什么?
感谢您的帮助!
答案 0 :(得分:0)
您可能有兴趣尝试其他方法将变量编码为mentioned here。您还可以查看this repository以了解文章中提到的各种方法的实现。这是documentation for the same。
否则,你必须按照@Vivek Kumar在评论中提到的两次通过这样做。