我希望能够将数据框中不相同的两个特定列组合成一个新列。
姓名 | 团队或俱乐部 | 课后活动 |
---|---|---|
吉尔 | 是 | 剧情 |
亚历克斯 | 是 | 足球 |
约翰 | 没有 | 导师 |
尼克 | ||
肖恩 | 是 | 篮球 |
丽莎 | 没有 | |
斯蒂芬 | 舞蹈 |
在这种情况下,我想将“团队或俱乐部”和“课后活动”列合并到一个新列中。
新列应如下所示。
组合 |
---|
是的,剧情 |
是的,足球 |
不,导师 |
是的,篮球 |
没有 |
舞蹈 |
抱歉,这不是正确的格式,我放了一个表格而不是显示我的代码或输出。我是新手,我还不知道该怎么做。
答案 0 :(得分:0)
from numpy import nan
只需使用 apply()
方法和 replace()
方法:
df=df.replace(nan,' ',regex=True)
combined=df[['Team or Club', 'After School Activity']].apply(','.join,1)
现在如果你打印 combined
你会得到你想要的输出