我是熊猫的新手,做了我的第一个脚本,将两个工作表合并为一个。我在多个行上有很多重复的数据,并且如果有意义的话,我想将一列中的相同值添加到其他重复的行中。例如
表格1。
Name PhoneNumber ItemOrdered
Jack 123-423-1423 Pizza
Sam 345-234-2336 Pie
表格2。
Name PhoneNumber Item Ordered
Jack NA Pie
Sam 345-234-2336 Pizza
当我加入两张纸时,我得到了
Name PhoneNumber ItemOrdered
Jack 123-423-1423 Pizza
Sam 345-234-2336 Pie
Jack NA Pie
Sam 345-234-2336 Pizza
例如,如何将电话号码值添加到jack的第二项?
答案 0 :(得分:0)
将Jack的电话号码添加到条目中可能不是最正确的操作。
import numpy as np
df.loc[df['Name']=='Jack',:] == '123-423-1423'
您应该做什么:
df_name_phonenumber = df[['Name','PhoneNumber']].copy().drop_duplicates()
del df['PhoneNumber']
df = pd.merge(df, df_name_phonenumber, on='Name', how='left') # Assuming no repeated names