我得到了一个包含名称和收入的csv文件。有些名称会多次显示。我想将它们合并,以使用熊猫仅获得一个唯一的名称,每个名称旁边都有收入。
我认为枢纽将是解决我的问题的方法。我尝试了以下方法:
df = pd.read_csv("properties.csv")
df = df.iloc[1:]
df = pd.DataFrame(df, columns= ['income', 'names'])
df['source'] = df['income'].astype(int)
test = pd.pivot_table(df, index='names', values='income')
问题是我想对自身而不是平均值进行编号。
例如:
名称1:2,3,2,3
名称2:1、2、4、1
代替:
名称1:2.5
名称2:2