如何计算熊猫列中变量的频率

时间:2020-02-06 16:11:37

标签: python-3.x pandas dataframe

我有以下数据框:df

    date        symbol  open     high      low    close    volume
0   2019-03-01   AMZN  1655.13  1674.26  1651.00  1671.73   4974877
1   2019-03-04   AMZN  1685.00  1709.43  1674.36  1696.17   6167358
2   2019-03-05   AMZN  1702.95  1707.80  1689.01  1692.43   3681522
3   2019-03-06   AMZN  1695.97  1697.75  1668.28  1668.95   3996001
4   2019-03-07   AMZN  1667.37  1669.75  1620.51  1625.95   4957017
5   2019-03-01   AAPL   174.28   175.15   172.89   174.97  25886167
6   2019-03-04   AAPL   175.69   177.75   173.97   175.85  27436203
7   2019-03-05   AAPL   175.94   176.00   174.54   175.53  19737419
8   2019-03-06   AAPL   174.67   175.49   173.94   174.52  20810384
9   2019-03-07   AAPL   173.87   174.44   172.02   172.50  24796374
10  2019-03-01   GOOG  1124.90  1142.97  1124.75  1140.99   1450316

我想获取AAPL在df ['symbol']中出现的次数。我不想使用:

df.groupby('symbol').size()

因为我对其他对象不感兴趣,所以原始数据集要大得多。

3 个答案:

答案 0 :(得分:1)

尝试一下:

len(df[df['symbol'] == 'AAPL'])

对我有用!

答案 1 :(得分:1)

您也可以尝试以下方法:

df[df['symbol'] == 'AAPL'].shape[0]

答案 2 :(得分:0)

Pandas Series 方法value_counts正是您所需要的。 Official manual

df['symbol'].value_counts()