我进行了一项调查,询问人们其销量范围。返回的数据是每个范围内受访者的百分比。我现在要计算熊猫的中位数销量。我已经在excel中完成了此操作,但是我有多个要在python中自动化的工作表。数据如下:
data = {'2018': [.28,.09,.08,.08,.1,.08,.06,.05,.04,.03,.03,.08,],
'2017': [.22,.09,.08,.08,.1,.08,.07,.06,.05,.03,.04,.11]}
df = pd.DataFrame(data=data, index=['Less than $500000','$500000-999999','$1000000-1499999','$1500000-1999999','$2000000-2999999','$3000000-3999999','$4000000-4999999','$5000000-5999999','$6000000-6999999','$7000000-7999999','$8000000-8999999','More than $10 million'])
display(df)
这是df:
2017 2018
Less than $500000 0.22 0.28
$500000-999999 0.09 0.09
$1000000-1499999 0.08 0.08
$1500000-1999999 0.08 0.08
$2000000-2999999 0.10 0.10
$3000000-3999999 0.08 0.08
$4000000-4999999 0.07 0.06
$5000000-5999999 0.06 0.05
$6000000-6999999 0.05 0.04
$7000000-7999999 0.03 0.03
$8000000-9999999 0.04 0.03
More than$10 million 0.11 0.08
例如,2018年有28%的受访者出售了不到500,000美元的产品,而只有8%出售了超过1,000万美元的产品。
当我跑步时:
df.median()
在2017年和2018年均返回.08,这是每列数字的中位数。但是我希望从索引中获得销量。在excel中,当我计算它时,2017年的平均销售额为410万美元,2018年的平均销售额为190万美元。
有人知道如何计算范围内数字百分比的中位数吗?预先感谢您的帮助。