查找列中值的频率分布

时间:2019-11-29 15:18:43

标签: python-3.x pandas dataframe

我有df(8360 x 3列)

            Time             A         B
0   01.01.2018 00:00:00   0.019098  32.437083
1   01.01.2018 01:00:00   0.018871  32.462083
2   01.01.2018 02:00:00   0.018643  32.487083
3   01.01.2018 03:00:00   0.018416  32.512083
4   01.01.2018 04:00:00   0.018189  32.537083
5   01.01.2018 05:00:00   0.017961  32.562083
6   01.01.2018 06:00:00   0.017734  33.189708
7   01.01.2018 07:00:00   0.017507  34.122968
8   01.01.2018 08:00:00   0.017279  32.897831
9   01.01.2018 09:00:00   0.017052  32.482338

,并希望将df分组到B列的数值之后 。我想找出列中的数字增加/减少幅度最大(频率分布)的范围。 知道我只使用df.describe()并玩数字。 例如,我发现它们是300个值,小于1个 new_df = df[df['B'] < 1]

是否有特定功能可以帮助我完成此任务?

1 个答案:

答案 0 :(得分:0)

要了解有关值分布的想法,只需绘制直方图即可。例如在Jupyter笔记本中:

%matplotlib inline
df.B.hist()

或使用scipy计算累积频率直方图

import scipy.stats
scipy.stats.cumfreq(df.B)