在不同列上进行过滤时,熊猫数据框的排序方式不同

时间:2019-04-16 13:43:29

标签: python python-3.x pandas dataframe

我正在使用散点划线来可视化表示我在IPL数据库上执行的数据分析。我有一堆从sql视图导出的csv。

现在我正在熊猫的帮助下阅读此csv,并根据我的过滤器将检索到的数据提供给绘图。

问题是,当将过滤器应用于不同的列时,数据将根据不同的列进行排序,即当我按season_id过滤数据时,将根据运行次数对进行排序,而当我过滤数据时通过team_bowling数据是根据match_id排序的。

我无法理解这种过滤或熊猫数据帧的行为。

这是我的代码和输出。

stats = pd.read_csv('data_files/All_Season_Batsman_Runs.csv', delimiter=',')
kohli = stats[stats.Player_Name == 'V Kohli'][stats.Season_Id == 1]
print(kohli)

filter done by season

stats = pd.read_csv('data_files/All_Season_Batsman_Runs.csv', delimiter=',')
kohli = stats[stats.Player_Name == 'V Kohli'][stats.Team_Bowling == 1]
print(kohli)

enter image description here

我正在使用

熊猫=> 0.23.4

Python => 3.7

1 个答案:

答案 0 :(得分:1)

查看索引号,原始文件已经进行了一些排序。可能是按季节运行。据我所知,没有什么意外的。