我有df(8360 x 3列)
Time A B
0 01.01.2018 00:00:00 0.019098 32.437083
1 01.01.2018 01:00:00 0.018871 32.462083
2 01.01.2018 02:00:00 0.018643 32.487083
3 01.01.2018 03:00:00 0.018416 32.512083
4 01.01.2018 04:00:00 0.018189 32.537083
5 01.01.2018 05:00:00 0.017961 32.562083
6 01.01.2018 06:00:00 0.017734 33.189708
7 01.01.2018 07:00:00 0.017507 34.122968
8 01.01.2018 08:00:00 0.017279 32.897831
9 01.01.2018 09:00:00 0.017052 32.482338
,并希望将df分组到B列的数值之后
。我想找出列中的数字增加/减少幅度最大(频率分布)的范围。
知道我只使用df.describe()
并玩数字。
例如,我发现它们是300个值,小于1个
new_df = df[df['B'] < 1]
是否有特定功能可以帮助我完成此任务?
答案 0 :(得分:0)
要了解有关值分布的想法,只需绘制直方图即可。例如在Jupyter笔记本中:
%matplotlib inline
df.B.hist()
或使用scipy计算累积频率直方图
import scipy.stats
scipy.stats.cumfreq(df.B)