熊猫与多索引数据集和重置索引融为一体-为什么这样做有效?

时间:2018-12-24 20:03:11

标签: python pandas dataframe

我直接从pandas文档中创建了此数据集:

In [28]: columns = pd.MultiIndex.from_tuples([('A', 'cat'), ('B', 'dog'),
   ....:                                      ('B', 'cat'), ('A', 'dog')],
   ....:                                     names=['exp', 'animal'])
   ....: 

In [29]: index = pd.MultiIndex.from_product([('one', 'two'),
                                             ('bar', 'baz', 'foo', 'qux')
   ....:                                     ],
   ....:                                    names=['first', 'second'])
   ....: 

In [30]: df = pd.DataFrame(np.random.randn(8, 4), index=index, columns=columns)

MultiIndex数据集(用于列和行)如下所示:

enter image description here

我想达到这样的效果[图像被截断,但您明白了]

enter image description here

可能有数不胜数的重塑方法,但我想使用unstack()和melt()完成它

这是我想出的两种方法:

    1. pd.melt(df.reset_index(),id_vars=['first','second'])
    2. pd.melt(df.unstack().reset_index(),id_vars=['first'])

这就是我遇到的问题:为什么这样做?

df.reset_index()给了我这个数据框

enter image description here

包含这些列

enter image description here

“第一”和“第二”未显示在列名中。它们是列exp的实际水平。所以我想知道如果我在融化中向id_vars添加更多级别会发生什么情况

如果我将融化更改为

pd.melt(df.reset_index(),id_vars=['first','second','A'])

我收到以下错误:

  

ValueError:数组的长度必须相同

如果我将融化更改为

pd.melt(df.reset_index(),id_vars=['first','second','dog'])

我收到以下错误:

  

KeyError:“狗”

有人可以用reset_index()直观地解释幕后发生的事情吗,为什么不熔化接受其他级别?为什么“第一”和“第二”显示为级别而不是列?

1 个答案:

答案 0 :(得分:1)

有一个名为stack的函数

yourdf=df.stack([0,1]).reset_index(name='value')