Question

我写了一个语法，按照Air_time对航空公司数据进行分组。

largest_airlines = flight_data.groupby(['AIRLINE'])['AIR_TIME'].count()
print (len(largest_airlines))
largest_airlines

输出为：

AIRLINE
AA     8720
AS      768
B6      540
DL    10539
EV     5697
F9     1305
HA      111
MQ     3314
NK     1486
OO     6425
UA     7680
US     1593
VX      986
WN     8310
Name: AIR_TIME, dtype: int64

我想过滤大于2500的数据。任何人都可以用相同的语法来帮助我。

Answer 1

这取决于您要使用哪种方法。

例如，在熊猫中，您可以使用类似以下的内容：

greater_than_2500_df = largest_airlines.loc[largest_airlines['Air_Time'] < 2500]

但这会有助于您先尝试一下。

在python中按大于groupby count语法过滤

1 个答案: