我想使用bin在Python中创建一个频率表。我的数据有一个“人口”栏目。
Population
563626
625741
672591
710231
814180
897934
989415
我想要达到的目标是:
Population
563626 - 625741
625741 - 672591
710231 - 814180
897934 - 989415 ...
并且能够指定要使用的箱数。有什么建议?
(我见过类似于R cut()
函数的东西。)
答案 0 :(得分:0)
最简单的方法是使用numpy.histogram:
import numpy as np
population = [
563626,
625741,
672591,
710231,
814180,
897934,
989415,
]
hist, bin_edges = np.histogram(a)<
可以使用bins
参数自定义容器的大小和位置。如果要返回密度而不是频率,请将density
参数设置为1.
我建议你阅读文档,它们非常详尽。