在Pandas中展开矩阵

时间:2018-05-03 09:58:27

标签: python pandas

我有一个像这样的矩阵:

df = pd.DataFrame({'a':[7, 0, 3], 'b':[0, 4, 2], 'c':[3, 2, 9]})
df.index = list(df)
df

    a   b   c
a   7   0   3
b   0   4   2
c   3   2   9

我想得到这样的东西:

C1  C2  V
0   a   a   7
1   a   b   0
2   a   c   3
3   b   a   0
4   b   b   4
5   b   c   2
6   c   a   3
7   c   b   2
8   c   c   9

我为此编写了以下代码:

vv = pd.DataFrame(columns=['C1', 'C2', 'V'])
i = 0
for cat1 in df.index:
    for cat2 in df.index:
        vv.loc[i] = [cat1, cat2, d[cat1][cat2]]
        i += 1
vv['V'] = vv['V'].astype(int)

有更好/更快/更优雅的方式吗?

5 个答案:

答案 0 :(得分:2)

In [90]: df = df.stack().reset_index()

In [91]: df.columns = ['C1', 'C2', 'v']

In [92]: df
Out[92]: 
  C1 C2  v
0  a  a  7
1  a  b  0
2  a  c  3
3  b  a  0
4  b  b  4
5  b  c  2
6  c  a  3
7  c  b  2
8  c  c  9

答案 1 :(得分:1)

您可以使用stack

df.stack()

a  a    7
   b    0
   c    3
b  a    0
   b    4
   c    2
c  a    3
   b    2
   c    9
dtype: int64

pd.set_option('display.multi_sparse', False)将对系列进行解算,显示每行中的值

此外,在管道中正确重命名

df.stack()
  .reset_index()
  .rename(columns={'level_0': 'C1', 'level_1': 'C2', 0:'V'})

的产率:

    C1  C2  V               
0   a   a   7
1   a   b   0
2   a   c   3
3   b   a   0
4   b   b   4
5   b   c   2
6   c   a   3
7   c   b   2
8   c   c   9

答案 2 :(得分:1)

你可以使用stack()方法,然后重置索引并重命名列。

df = pd.DataFrame({'a':[7, 0, 3], 'b':[0, 4, 2], 'c':[3, 2, 9]})
df.index = list(df)
result = df.stack().reset_index().rename(columns={'level_0':'C1', 'level_1':'C2',0:'V'})

print(result)

  C1 C2  V
0  a  a  7
1  a  b  0
2  a  c  3
3  b  a  0
4  b  b  4
5  b  c  2
6  c  a  3
7  c  b  2
8  c  c  9

答案 3 :(得分:1)

使用:

df = (df.rename_axis('C2')
        .reset_index()
        .melt('C2', var_name='C1', value_name='V')
        .reindex(columns=['C1','C2','V']))
print (df)
  C1 C2  V
0  a  a  7
1  a  b  0
2  a  c  3
3  b  a  0
4  b  b  4
5  b  c  2
6  c  a  3
7  c  b  2
8  c  c  9

答案 4 :(得分:0)

为了完成答案并获得相同的输出,我添加了以下代码:

vv = df.stack().reset_index()
vv.columns = ['C1', 'C2', 'V']