我有一个长DataFrame
,其ID重复可变的次数,例如以下示例:
raw_data = {'ids': ['id1', 'id1', 'id2', 'id2', 'id2', 'id3', 'id4', 'id4', 'id4', 'id4'],
'values' : ['some', 'thing', 'some', 'other', 'thing', 'third', 'even', 'four', 'thing', 'possible']}
df = pd.DataFrame(raw_data, columns = ['ids', 'values'])
df
ids values
0 id1 some
1 id1 thing
2 id2 some
3 id2 other
4 id2 thing
5 id3 third
6 id4 even
7 id4 four
8 id4 thing
9 id4 possible
我需要输出像这样:
{'id1' : ['some', 'thing'],
'id2' : ['some', 'other', 'thing'],
'id3' : ['third'],
'id4' : ['even', 'four', 'thing', 'possible']}
但是,它不必是字典。我需要那些清单。
我可以轻松地进行for循环,但是我想知道熊猫是否提供了一些魔力?首先,我尝试使用pd.pivot(),但我认为这并不是我真正需要的。帮助吗?