在作业中,要求我们找到具有多个匹配项的ID。就像在数据库中一样,存在一对多的关系。
我只能指定两个ID不匹配。由于不同的计数数不同。
import numpy as np
import pandas as pd
player_att = pd.read_csv('Player_Attributes.csv',sep = ',')
player_att.head()
player_att.player_fifa_api_id.nunique()
player_att.player_api_id.nunique()
对于以上代码,结果为11062、11060。也就是说,两个ID号不匹配。但是如何找到具有多个fifa_api_id的那个?
答案 0 :(得分:0)
尝试:
player_att.groupby('player_fifa_api_id').player_api_id.count()
基本上,groupby
将收集所有具有相同player_fifa_api_id
的行,并且count
返回每个组的编号(计数)。
此后,您有一个名为player_api_id
的系列,并由player_fifa_api_id
进行了索引。如果您想玩多个player_api_id
的玩家,那么请看该值大于1的系列。