我一直在使用面板来代替具有多级索引的数据框架,因为对于大型数据集来说它们似乎更快。但我现在正在转向Midx框架。有了面板,我可以轻松地做到这一点:
connect
然后添加一个新项目:
events
但是对于Midx:
redux
这会返回错误:
import pandas as pd
pan = pd.Panel(np.random.randn(3,5,2),items=['p1','p2','p3'],minor_axis=['a','b'])
ValueError:传递的项目数量错误2,展示位置意味着1
答案 0 :(得分:1)
您可以使用concat
,因为您尝试分配数据帧并且您有多级列,即
第1步:将数据框设为多级列数据框
samp = pd.DataFrame(pd.np.random.randn(10,2),columns=['a','b'])
p4 = pd.concat([samp], keys=['p4'],axis=1)
或者:
new_idx = pd.MultiIndex.from_product([['p4'],['a','b']])
p4 = pd.DataFrame(pd.np.random.randn(10,2),columns=new_idx)
Step2 :Concat两个数据帧
ndf = pd.concat([df_midx,p4] ,axis=1)
p1 p2 p3 p4 \
a b a b a b a
0 -0.345972 -0.091595 1.524982 -1.181117 -1.288529 -1.295967 0.199311
1 -0.398007 0.805862 0.109550 0.449695 0.342036 0.516858 1.128231
2 -1.141256 0.614402 1.512875 -1.469454 0.637108 -0.413336 -1.483573
3 -0.018409 0.842007 0.170275 1.731468 0.022853 -1.665722 -1.174225
4 -0.407416 0.635482 -0.486413 0.090096 0.489290 -1.704067 -2.228681
5 0.283725 -1.314413 0.382782 -1.139884 0.607638 -1.682241 1.479211
6 0.369212 0.378822 -0.714765 -0.796454 0.840744 1.399895 -1.204143
7 1.214798 -0.134845 1.274823 -0.319794 1.658468 1.442076 -2.118546
8 0.305107 -1.649617 -0.424912 1.520576 -1.285289 0.476907 -1.104102
9 1.175882 -1.677547 -0.842787 -0.585976 0.046749 -0.369360 -1.339593
b
0 -0.438747
1 0.395792
2 0.561690
3 -0.739772
4 0.745308
5 0.734140
6 0.112849
7 0.314292
8 2.363909
9 -1.741678