如何根据熊猫中另一列的值组合字符串列表的行?

时间:2021-04-02 08:57:40

标签: python pandas dataframe

我有一张这样的桌子:

|Name |Txt              |
| --- |-----------------|
|Mike |[I like pie]     |
|Jason| [Good morning] |
|Mike | [good afternoon]|
|Jason| [One two three]|

我想把它变成这样:

|Name |Txt                        |
| --- | ------------------------- |
|Mike |I like pie Good morning    |
|Jason| Good morning One two three|

Txt 列应该准备好进行单词标记化。顺便说一句,原始数据有超过 50k 行...

我曾尝试使用 groupby.apply(lambda x: " ".join(x["Txt"])),但不知何故无法正常工作。

我也尝试过使用 str.cat(sep=" "),但我只能将它们全部合并到一个大文件中。

希望有人能帮我解决!

1 个答案:

答案 0 :(得分:2)

使用groupbystr.cat()

df.groupby('Name')['Text'].apply(lambda x:x.str.cat(sep=" "))