Question

我有一个这种形式的numpy数组：

我想重新排列它，以便将列堆叠在一起，保持其初始索引（可能是新列）。

我想结束这样的事情：

Jan2017 | 0 | 0
Feb2017 | 0 | 1
Mar2017 | 0 | 1
...
Jan2017 | 1 | 0 
Feb2017 | 1 | 0 etc

其中第一列和第二列表示初始数组的索引

Answer 1

您可以堆叠一个索引数组以及您（可能）DataFrame中的展平和转置值。

例如：

将pandas导入为pd

df = pd.DataFrame({0: [0,1,1,0,0,1,0],
                   1: [0,0,0,0,0,1,0],
                   2: [1,0,1,0,1,0,0]},
                  index=['Jan2017', 'Feb2017', 'Mar2017', 'Apr2017', 'May2017', 'Jun2017', 'Jul2017'])

可以像这样处理：

>>> np.stack([np.repeat(np.arange(len(df.columns)), len(df)), df.values.T.ravel()], axis=1)
array([[0, 0],
       [0, 1],
       [0, 1],
       [0, 0],
       [0, 0],
       [0, 1],
       [0, 0],
       [1, 0],
       [1, 0],
       [1, 0],
       [1, 0],
       [1, 0],
       [1, 1],
       [1, 0],
       [2, 1],
       [2, 0],
       [2, 1],
       [2, 0],
       [2, 1],
       [2, 0],
       [2, 0]], dtype=int64)

np.repeat用于创建索引：

>>> np.repeat(np.arange(len(df.columns)), len(df))
array([0, 0, 0, 0, 0, 0, 0, 1, 1, 1, 1, 1, 1, 1, 2, 2, 2, 2, 2, 2, 2])

.T转换了数组，ravel展平了它：

>>> df.values.T.ravel()
array([0, 1, 1, 0, 0, 1, 0, 0, 0, 0, 0, 0, 1, 0, 1, 0, 1, 0, 1, 0, 0], dtype=int64)

然后使用np.stack

堆叠“逐行”（因此axis=1）

Answer 2

假设矩阵已保存在A中，那么您可以通过A.transpose().flatten()

获取向量

import numpy as np

A = np.arange(12).reshape(3,4)

print(A)
print(A.transpose().flatten())

将2D numpy数组重新排列为列向量，保持行索引

2 个答案: