Question

我正在使用散点划线来可视化表示我在IPL数据库上执行的数据分析。我有一堆从sql视图导出的csv。

现在我正在熊猫的帮助下阅读此csv，并根据我的过滤器将检索到的数据提供给绘图。

问题是，当将过滤器应用于不同的列时，数据将根据不同的列进行排序，即当我按season_id过滤数据时，将根据运行次数对进行排序，而当我过滤数据时通过team_bowling数据是根据match_id排序的。

我无法理解这种过滤或熊猫数据帧的行为。

这是我的代码和输出。

stats = pd.read_csv('data_files/All_Season_Batsman_Runs.csv', delimiter=',')
kohli = stats[stats.Player_Name == 'V Kohli'][stats.Season_Id == 1]
print(kohli)

stats = pd.read_csv('data_files/All_Season_Batsman_Runs.csv', delimiter=',')
kohli = stats[stats.Player_Name == 'V Kohli'][stats.Team_Bowling == 1]
print(kohli)

我正在使用

熊猫=> 0.23.4

Python => 3.7

Answer 1

查看索引号，原始文件已经进行了一些排序。可能是按季节运行。据我所知，没有什么意外的。

在不同列上进行过滤时，熊猫数据框的排序方式不同

1 个答案: