pandas get_group导致内存错误

时间:2015-02-01 13:13:03

标签: python pandas out-of-memory

我有一个像这样创建的分组数据框:

my_gb = pandas.read_csv(filepath_or_buffer=my_file_path,
                        delimiter='\t').groupby(['col1', 'col2', 'col3', 'col4'])

然后我致电get_group

my_row = my_gb.get_group((val1, val2, val3, val4))

获得MemoryError

IIUC,这只返回一行的视图(在我的数据集中) - 这怎么会导致内存错误?

1 个答案:

答案 0 :(得分:0)

无法让这个工作,所以我自己进行了分组:

data = pandas.read_csv(filepath_or_buffer=my_file_path, delimiter='\t')
grouped = {}
for key, value in data.iterrows():
    grouped[(value['col1'], value['col2'], value['col3'], value['col4'])] = value