我为一个大于50.000行的.csv导入了大型矩阵。
我正在使用panda和numpy,该矩阵是一个电影数据库,我想按预算对矩阵进行排序,并查看例如显示该矩阵所有列的第10行。
示例:按收入排序,这是我的目标。
IMDb_data[['film', 'budget', 'revenue','vote_average','cast']].head(3)
film budget revenue vote_average ..... cast director homepage
J.Park 100000 150 5 ..... AAA BBB CCC.com
Sun 50000 75 4 ..... AAA BBB CCC.com
Night 2000 50 3 ..... AAA BBB CCC.com
用于导入IMDb_data的代码:
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
IMDb_data= pd.read_csv('tmdb-movies.csv')
答案 0 :(得分:1)
您正在寻找sort_values
方法,可以通过哪一列和顺序(升序或降序)来精确定位
df.sort_values(by='budget', ascending=False)
有关更多关键字,您可以查看官方documentation
by
正在使用一个字符串(用于对一列进行排序)或一个字符串列表,以按字典顺序进行排序
ascending
的布尔值(默认为True)
答案 1 :(得分:0)
IMDb_data.sort_values(by=['budget'], ascending=False)
以按预算排序。
IMDb_data.sort_values(by=['revenue'], ascending=False)
以按收入排序。