所以我只是想学习Python,并建立了一个像这样的直方图:
我一直在疯狂地试图找出如何以表格格式显示相同的数据,即:
0-5 = 50,500
5-10 = 24,000
10-50 = 18,500
以此类推...
df中只有一个字段,其中包含城镇/城市中的居民人数。任何帮助将不胜感激。
编辑:
从重复的问题答案中...我遇到了错误
bins = [0,5,10,50,150,500,2500,5000,8000]
groups = df.groupby(['Total_Residents', pd.cut(df.Total_Residents, bins)])
groups.size().unstack()
AttributeError跟踪(最近一次通话) 在()中 1箱= [0,5,10,50,150,500,2500,5000,8000] ----> 2组= df.groupby(['Total_Residents',pd.cut(df.Total_Residents,bins)]) 3组。size()。unstack()
〜\ AppData \ Local \ Continuum \ anaconda3 \ lib \ site-packages \ pandas \ core \ generic.py在 getattr 中(自身,名称) 第4370章死神来了 4371返回自身[名称] -> 4372返回对象。 getattribute ((自身,名称) 4373 4374 def setattr (自身,名称,值):
AttributeError: 'Series' object has no attribute 'Total_Residents'
编辑:对于样本数据,您可以使用bin值+1
df = pd.Series([1,6,11,51,151,501,2501,5001,8001,name ='Total_Residents')
但是,我的数据没有引起问题。就是我在使用pandas函数,该函数用于一系列数据上的数据框。
答案 0 :(得分:0)
弄清楚了。我实际上无法将“系列”转换为数据框,但熊猫能够处理系列:
bins = [0,5,10,50,150,500,2500,5000,8000]
df.value_counts(bins=bins)
我需要使用value_counts函数。
仅当我有另一列将数据分组时,我才能使用建议重复的答案。