我直接从pandas文档中创建了此数据集:
In [28]: columns = pd.MultiIndex.from_tuples([('A', 'cat'), ('B', 'dog'),
....: ('B', 'cat'), ('A', 'dog')],
....: names=['exp', 'animal'])
....:
In [29]: index = pd.MultiIndex.from_product([('one', 'two'),
('bar', 'baz', 'foo', 'qux')
....: ],
....: names=['first', 'second'])
....:
In [30]: df = pd.DataFrame(np.random.randn(8, 4), index=index, columns=columns)
MultiIndex数据集(用于列和行)如下所示:
我想达到这样的效果[图像被截断,但您明白了]
可能有数不胜数的重塑方法,但我想使用unstack()和melt()完成它
这是我想出的两种方法:
1. pd.melt(df.reset_index(),id_vars=['first','second'])
2. pd.melt(df.unstack().reset_index(),id_vars=['first'])
这就是我遇到的问题:为什么这样做?
df.reset_index()
给了我这个数据框
包含这些列
“第一”和“第二”未显示在列名中。它们是列exp的实际水平。所以我想知道如果我在融化中向id_vars添加更多级别会发生什么情况
如果我将融化更改为
pd.melt(df.reset_index(),id_vars=['first','second','A'])
我收到以下错误:
ValueError:数组的长度必须相同
如果我将融化更改为
pd.melt(df.reset_index(),id_vars=['first','second','dog'])
我收到以下错误:
KeyError:“狗”
有人可以用reset_index()直观地解释幕后发生的事情吗,为什么不熔化接受其他级别?为什么“第一”和“第二”显示为级别而不是列?
答案 0 :(得分:1)
有一个名为stack
的函数
yourdf=df.stack([0,1]).reset_index(name='value')