所以我有一个数据框
姓名 | 电话 | 地址 | 邻里 |
---|---|---|---|
client1 | xxxxx | 街道 | 布鲁克林------ |
client2 | xxxxx | BStreet | 布鲁克林------ |
等等...
我需要将每一行中的单元格“组合”成一个包含所有信息的单元格,占据 4 列。它应该是这样的:
姓名 | 电话 | 地址 | 邻里 |
---|---|---|---|
client1, xxxxx, AStreet, 布鲁克林 -------- | |||
client2, xxxxx, BStreet, 布鲁克林 -------- |
如何做到这一点?这甚至可能吗?抱歉,格式不正确,该指南对如何呈现正确的数据框没有太大帮助。
我研究了许多用于数据帧的 Pandas 方法,但找不到答案(也许我没有注意到它可能是一个解决方案,因为我是初学者程序员)
答案 0 :(得分:0)
在 Pandas 中没有明确的操作。
然而,一个直接的解决方案是这样的:
df['name'] = df['name'] + ', ' + df['phone'] + ', ' + df['address'] + ', ' + df['phone']
df['phone'] = df['address'] = df['neighborhood'] = ''
您可以随时改进这一点(例如,在赋值中使用 join
子句):
df['name'] = df.apply(', '.join, axis=1)
df['phone'] = df['address'] = df['neighborhood'] = ''
答案 1 :(得分:0)
IIUC 这就是你想要的:
out = pd.DataFrame(columns = df.columns)
df.iloc[:,:-1] += ', '
out["name"] = df.sum(1)
输出
name phone address neighborhood
0 client1, xxxxx, AStreet, Brooklyn ------ NaN NaN NaN
1 client2, xxxxx, BStreet, Brooklyn ------ NaN NaN NaN