如何从Kaggle Football数据中找到具有多个匹配项的ID

时间:2019-03-30 20:01:49

标签: python pandas pandas-groupby

在作业中,要求我们找到具有多个匹配项的ID。就像在数据库中一样,存在一对多的关系。

我只能指定两个ID不匹配。由于不同的计数数不同。

import numpy as np
import pandas as pd
player_att = pd.read_csv('Player_Attributes.csv',sep = ',') 
player_att.head()

player_att.player_fifa_api_id.nunique()  
player_att.player_api_id.nunique()

对于以上代码,结果为11062、11060。也就是说,两个ID号不匹配。但是如何找到具有多个fifa_api_id的那个?

1 个答案:

答案 0 :(得分:0)

尝试:

player_att.groupby('player_fifa_api_id').player_api_id.count()

基本上,groupby将收集所有具有相同player_fifa_api_id的行,并且count返回每个组的编号(计数)。

此后,您有一个名为player_api_id的系列,并由player_fifa_api_id进行了索引。如果您想玩多个player_api_id的玩家,那么请看该值大于1的系列。