Question

我是熊猫的新手，做了我的第一个脚本，将两个工作表合并为一个。我在多个行上有很多重复的数据，并且如果有意义的话，我想将一列中的相同值添加到其他重复的行中。例如

表格1。

 Name PhoneNumber ItemOrdered

Jack 123-423-1423    Pizza

Sam 345-234-2336     Pie

表格2。

Name PhoneNumber Item Ordered

Jack     NA           Pie

Sam     345-234-2336     Pizza

当我加入两张纸时，我得到了

 Name PhoneNumber ItemOrdered

Jack   123-423-1423    Pizza

Sam   345-234-2336      Pie

Jack      NA           Pie


Sam  345-234-2336     Pizza

例如，如何将电话号码值添加到jack的第二项？

Answer 1

将Jack的电话号码添加到条目中可能不是最正确的操作。

import numpy as np
df.loc[df['Name']=='Jack',:] == '123-423-1423'

您应该做什么：

df_name_phonenumber = df[['Name','PhoneNumber']].copy().drop_duplicates()
del df['PhoneNumber']
df = pd.merge(df, df_name_phonenumber, on='Name', how='left') # Assuming no repeated names

使用熊猫将相同的值添加到其他行

1 个答案: