说我有下面的数据框:
d = {'name_col': ['name1', 'name2', 'name1'], 'tag_col': ['tag1', 'tag2', 'tag3']}
df = pd.DataFrame(data=d)
+----------+---------+
| name_col | tag_col |
+----------+---------+
| name1 | tag1 |
+----------+---------+
| name2 | tag2 |
+----------+---------+
| name1 | tag3 |
+----------+---------+
如何合并具有相同name_col
的行,并将标记附加到tag_col
中的一行中,然后删除另一行,即输出将是
+----------+------------+
| name_col | tag_col |
+----------+------------+
| name1 | tag1; tag3 |
+----------+------------+
| name2 | tag2 |
+----------+------------+
下面的代码不会导致数据框
df.groupby('name_col')['tag_col'].agg(';'.join)