我有一个像这样的数据框
Name Data
0 file1 a
1 file2 b
2 file1 c
3 file1 d
4 file2 e
我想按“名称”分组,并将“数据”列连接起来。
输出应如下所示:
file1 acd
file2 be
我不知道该怎么做。我可以将数据框转换为列表,然后运行for循环并执行此操作。但我正在尝试看看是否有更好的方法可以不使用列表。
提前谢谢!
答案 0 :(得分:2)
您只能groupby
和sum
:
print (df.groupby("Name").sum())
Data
Name
file1 acd
file2 be
答案 1 :(得分:1)
类似df.groupby('Name').apply(lambda x: ''.join(x['Data']))
的东西应该可以帮助您...在sql中查看group_concat,您正在寻找要完全做到的