我正在使用散点划线来可视化表示我在IPL数据库上执行的数据分析。我有一堆从sql视图导出的csv。
现在我正在熊猫的帮助下阅读此csv,并根据我的过滤器将检索到的数据提供给绘图。
问题是,当将过滤器应用于不同的列时,数据将根据不同的列进行排序,即当我按season_id过滤数据时,将根据运行次数对进行排序,而当我过滤数据时通过team_bowling数据是根据match_id排序的。
我无法理解这种过滤或熊猫数据帧的行为。
这是我的代码和输出。
stats = pd.read_csv('data_files/All_Season_Batsman_Runs.csv', delimiter=',')
kohli = stats[stats.Player_Name == 'V Kohli'][stats.Season_Id == 1]
print(kohli)
stats = pd.read_csv('data_files/All_Season_Batsman_Runs.csv', delimiter=',')
kohli = stats[stats.Player_Name == 'V Kohli'][stats.Team_Bowling == 1]
print(kohli)
我正在使用
熊猫=> 0.23.4
Python => 3.7
答案 0 :(得分:1)
查看索引号,原始文件已经进行了一些排序。可能是按季节运行。据我所知,没有什么意外的。