我有一个如下所示的CSV文件:
25,57
25,60
35,60
35,60
35,60
45,70
45,70
...
我需要的是从这个文件创建一个新的csv文件,它只保留第一列的一个条目,并对第一列的值相同的第二列的所有值求和。
我需要从上面做出的例子:
25, 117
35, 180
45, 140
注意:我尝试过pandas grouby,我的图书馆出现了错误......
尝试过的代码:
IdandScoreArray = np.empty((27,2),dtype = int) 用f作为csvfile:
csvreader = csv.DictReader(csvfile)
for row in csvreader:
IdScore = (row['user_id'], row['grade_id'])
IdandScoreArray = np.append(IdandScoreArray, [IdScore], axis = 0)
df = pd.DataFrame(IdandScoreArray,columns = [' First',' Second'])
df.groupbby('首先&#39)。总和
print df
(类似的东西)
答案 0 :(得分:1)
我在Pandas数据框架上看不到groupby
的任何问题。
import pandas as pd
df = pd.read_csv('data/data.csv', header=None)
df = df.groupby([0])[1].sum()
df.to_csv('data/group.csv')
根据data.csv
中输入的样本数据,我在group.csv
25,117
35,180
45,140