根据熊猫项目列表查找项目

时间:2018-12-06 18:24:55

标签: python pandas dataframe

我有一个数据框nba2(很抱歉,在本地文件上工作,否则我将只发布整个jupyter笔记本)。

我使用以下命令从excel文件设置df:

# create a new dataframe with only columns we want to look at (we can always edit this later) in order

nba2= nba1[['Year', 'Tm', 'Player', 'G', 'BPM', 'VORP', 'WORP', 'MP']].copy()

# adding a % of minutes played stat that we can use to normalize results later
nba2['MIN'] = (nba1['MP']/ (48* 82))

我的最终目标是创建一个球队列表(groupby ?,每个球队都包含上一年度的球员及其状态的列表。

例如,我想要列出2012年纽约尼克斯队的所有球员,但要列出他们的2011年VORP,BPM和WORP,我以后可以进行小计。

我最终将探讨球员去年的数据与球队总胜利之间的关系。

我认为我需要做一些for循环迭代来查看当前球队的花名册组成,然后在df中找到该球员的前一年实例。

我尝试过:

for year in years:
for team in teams:
    players = nba2[(nba2.Year == year) & (nba2.Tm == team)]['Player'].values # get distinct if needed
    data = nba2[(nba2.Year == year-1) & (nba2.Player.isin(players))] 

但收到错误

name 'years is not defined'

0 个答案:

没有答案