Question

我为一个大于50.000行的.csv导入了大型矩阵。

我正在使用panda和numpy，该矩阵是一个电影数据库，我想按预算对矩阵进行排序，并查看例如显示该矩阵所有列的第10行。

示例：按收入排序，这是我的目标。

IMDb_data[['film', 'budget', 'revenue','vote_average','cast']].head(3)

film    budget  revenue   vote_average ..... cast   director    homepage
J.Park  100000    150          5       .....  AAA      BBB      CCC.com
Sun     50000     75           4       .....  AAA      BBB      CCC.com
Night    2000     50           3       .....  AAA      BBB      CCC.com

用于导入IMDb_data的代码：

import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
IMDb_data= pd.read_csv('tmdb-movies.csv')

Answer 1

您正在寻找sort_values方法，可以通过哪一列和顺序（升序或降序）来精确定位

df.sort_values(by='budget', ascending=False)

有关更多关键字，您可以查看官方documentation

by正在使用一个字符串（用于对一列进行排序）或一个字符串列表，以按字典顺序进行排序

ascending的布尔值（默认为True）

Answer 2

IMDb_data.sort_values(by=['budget'], ascending=False)以按预算排序。

IMDb_data.sort_values(by=['revenue'], ascending=False)以按收入排序。

pandas.DataFrame.sort_values

Python-如何排序矩阵

2 个答案: