Pandas - 根据其他列中的值向列添加数据

时间:2018-05-31 19:55:11

标签: python pandas dataframe rows

所以我真的得到了这个。一个.csv文件:

,year,team,tr_diff,ranking
0,2010,ADO Den Haag,3.9473684210526314,N/A
1,2011,ADO Den Haag,1.5120274914089347,N/A
2,2012,ADO Den Haag,-1.2320328542094456,N/A
3,2013,ADO Den Haag,-3.757828810020877,N/A

这是我的代码:

rankings = [('ADO Den Haag', 12, 2010), ('ADO Den Haag', 16, 2011), .... ('ADO Den Haag', 12, 2013)]

df = pd.read_csv('preliminary.csv')
for tuple in rankings:      
    df.loc[(df['team'] == tuple[0]) & (df['year'] == tuple[2]), 'ranking'] = tuple[1]

目标是找到具有正确团队名称和年份的列,并在“排名”列中添加该行,该排名可以在元组的第2项中找到。我怎样才能做到这一点?此代码不会引发任何错误,但它不会执行我想要的操作。我希望的行为就是这个。

,year,team,tr_diff,ranking
0,2010,ADO Den Haag,3.9473684210526314,12
1,2011,ADO Den Haag,1.5120274914089347,16
2,2012,ADO Den Haag,-1.2320328542094456,14
3,2013,ADO Den Haag,-3.757828810020877,15
4,2014,ADO Den Haag,2.5974025974025974,11
5,2015,ADO Den Haag,3.4702549575070822,8
6,2016,ADO Den Haag,-4.3626448534424,12

我做错了什么?

1 个答案:

答案 0 :(得分:1)

您不需要遍历元组列表。请改用.merge()。假设rankings中的每个条目df都有一个条目,您需要:

ranking_df = pd.DataFrame(rankings, columns=['team', 'ranking', 'year'])
new_df = df.drop(['ranking'], axis=1).merge(ranking_df, on=['team', 'year'], how='left')

输入:

     year   team             tr_diff    ranking
0   2010    ADO Den Haag    3.947368    NaN
1   2011    ADO Den Haag    1.512027    NaN
2   2012    ADO Den Haag    -1.232033   NaN
3   2013    ADO Den Haag    -3.757829   NaN

输出:

    year    team             tr_diff    ranking
0   2010    ADO Den Haag    3.947368    12.0
1   2011    ADO Den Haag    1.512027    16.0
2   2012    ADO Den Haag    -1.232033   NaN
3   2013    ADO Den Haag    -3.757829   NaN