多数据问卷名义价值-如何汇总

时间:2019-01-21 10:32:39

标签: python pandas numpy statistics

我在时隙中有数据。

ds = [ds01, ds02, ds03, ds04, ...]

使用以下方法获取循环中的结果:

nhelp = []
for d in ds:
    nhelp.append(d.groupby(list(d)[1]).size().sum)  #single column
nhelp

例如最喜欢的颜色(在调查表中将数据表示为1 2 3 ...) 我在这里得到:

[<bound method Series.sum of color
1.0    215
2.0    202
3.0    215
4.0    178
dtype: int64>, <bound method Series.sum of color
1.0    252
2.0    244
3.0    241
4.0    133
dtype: int64>, <bound method Series.sum of color
........ 
dtype: int64>]

现在,我想总结所有时间段的颜色,并在单个图表中显示结果。 (在这里,我尝试了数据透视,交叉表,循环,-将列表转换为数组或/和数据框-求和和绘图失败,也无法迭代此变量,但是我可以访问值,例如nhelp [1] [1])

1 个答案:

答案 0 :(得分:0)

我认为您需要按concat联接所有数据,然后按Index求和:

nhelp = []
for d in ds:
    nhelp.append(d.groupby(list(d)[1]).size())

out = pd.concat(nhelp).sum(level=0)

或列表理解:

nhelp = [d.groupby(list(d)[1]).size() for d in ds]
out = pd.concat(nhelp).sum(level=0)