我写了一个语法,按照Air_time对航空公司数据进行分组。
largest_airlines = flight_data.groupby(['AIRLINE'])['AIR_TIME'].count()
print (len(largest_airlines))
largest_airlines
输出为:
AIRLINE
AA 8720
AS 768
B6 540
DL 10539
EV 5697
F9 1305
HA 111
MQ 3314
NK 1486
OO 6425
UA 7680
US 1593
VX 986
WN 8310
Name: AIR_TIME, dtype: int64
我想过滤大于2500的数据。任何人都可以用相同的语法来帮助我。
答案 0 :(得分:0)
这取决于您要使用哪种方法。
例如,在熊猫中,您可以使用类似以下的内容:
greater_than_2500_df = largest_airlines.loc[largest_airlines['Air_Time'] < 2500]
但这会有助于您先尝试一下。