我正在寻找一种方法来获得几个城市的人口年龄中位数。事实上,我有一个这样的数据框:
city pop age1 age2 age3 age4 ... age100
city1 4752 36 39 39 37 ... 1
city2 19019 197 166 206 159 ... 2
city3 20510 192 188 190 168 ... 3
我的期望是这样的输出:
city pop age1 age2 age3 age4 ... age100 median
city1 4752 36 39 39 37 ... 1 age45
city2 19019 197 166 206 159 ... 2 age57
city3 20510 192 188 190 168 ... 3 age52
更新
在我了解到没有idxmedian-Function之后,我有了不同的想法。我想我只需要一个循环来总结age1,age2,age3 ...的值,直到总和大于或等于((pop + 1) / 2)
。然后它应该在df ['median']中打印列名。