尝试使用df.idxmax

时间:2017-06-14 14:39:53

标签: python pandas machine-learning

我有一个包含49700行和790列的数据帧。我想为每一行获取具有最大值的列。以下是我的代码:

df['Max'] = df.idxmax(axis = 1)   

我收到内存错误。有什么方法可以解决这个问题。

1 个答案:

答案 0 :(得分:0)

您使用的是32位系统吗?我的32位系统上的数据帧操作也存在内存问题。数据框包含一个大约350mb的csv文件。

我的脚本适用于多个数据帧,因此我的解决方法是在此数据帧操作之前从内存中删除一些其他数据帧。 我是通过将其他数据框设置为"无"。

来完成的