Question

我有df（8360 x 3列）

            Time             A         B
0   01.01.2018 00:00:00   0.019098  32.437083
1   01.01.2018 01:00:00   0.018871  32.462083
2   01.01.2018 02:00:00   0.018643  32.487083
3   01.01.2018 03:00:00   0.018416  32.512083
4   01.01.2018 04:00:00   0.018189  32.537083
5   01.01.2018 05:00:00   0.017961  32.562083
6   01.01.2018 06:00:00   0.017734  33.189708
7   01.01.2018 07:00:00   0.017507  34.122968
8   01.01.2018 08:00:00   0.017279  32.897831
9   01.01.2018 09:00:00   0.017052  32.482338

，并希望将df分组到B列的数值之后。我想找出列中的数字增加/减少幅度最大（频率分布）的范围。知道我只使用df.describe()并玩数字。例如，我发现它们是300个值，小于1个 new_df = df[df['B'] < 1]

是否有特定功能可以帮助我完成此任务？

Answer 1

要了解有关值分布的想法，只需绘制直方图即可。例如在Jupyter笔记本中：

%matplotlib inline
df.B.hist()

或使用scipy计算累积频率直方图

import scipy.stats
scipy.stats.cumfreq(df.B)

查找列中值的频率分布

1 个答案: