我有一个像这样创建的分组数据框:
my_gb = pandas.read_csv(filepath_or_buffer=my_file_path,
delimiter='\t').groupby(['col1', 'col2', 'col3', 'col4'])
然后我致电get_group
:
my_row = my_gb.get_group((val1, val2, val3, val4))
获得MemoryError
。
IIUC,这只返回一行的视图(在我的数据集中) - 这怎么会导致内存错误?
答案 0 :(得分:0)
无法让这个工作,所以我自己进行了分组:
data = pandas.read_csv(filepath_or_buffer=my_file_path, delimiter='\t')
grouped = {}
for key, value in data.iterrows():
grouped[(value['col1'], value['col2'], value['col3'], value['col4'])] = value