我有一张这样的桌子:
|Name |Txt |
| --- |-----------------|
|Mike |[I like pie] |
|Jason| [Good morning] |
|Mike | [good afternoon]|
|Jason| [One two three]|
我想把它变成这样:
|Name |Txt |
| --- | ------------------------- |
|Mike |I like pie Good morning |
|Jason| Good morning One two three|
Txt 列应该准备好进行单词标记化。顺便说一句,原始数据有超过 50k 行...
我曾尝试使用 groupby.apply(lambda x: " ".join(x["Txt"]))
,但不知何故无法正常工作。
我也尝试过使用 str.cat(sep=" ")
,但我只能将它们全部合并到一个大文件中。
希望有人能帮我解决!
答案 0 :(得分:2)
使用groupby
、str.cat()
df.groupby('Name')['Text'].apply(lambda x:x.str.cat(sep=" "))