熊猫:从宽到长的转换:如何获取行号和列号

时间:2019-03-05 16:31:55

标签: python-3.x pandas

初学者问题: 我有一个可以说3x3的矩阵,我想将其转换为如下所示的长格式:

宽:

    A      B    C
A   0.1    0.2    0.3
B   0.1    0.2    0.3 
C   0.1    0.2    0.3

长:

    Col1  Col2  Row_num Col_num Value

0   A     A     1        1     0.1
1   A     B     1        2     0.2
2   A     C     1        3     0.3
.
.
8   C     C     3        3     0.3

我尝试了各种功能,例如melt,unstack(),wide_to_long,但无法获取列号。做这个的最好方式是什么 ?

谢谢

2 个答案:

答案 0 :(得分:1)

我确定有一种更有效的方法,因为我的方法涉及两个for循环,但这是一种快速而又肮脏的方式来转换数据,就像您正在寻找的那样:

# df is your initial dataframe
df = pd.DataFrame({"A": [1,1,1],
                   "B": [2,2,2],
                   "C": [3,3,3]}, 
                   index=["A","B","C"])

#long_rows will store the data we need for the new df
long_rows = []

# loop through each row 
for i in range(len(df)):

    #loop through each column
    for j in range(len(df.columns)):

        ind = list(df.index.values)[i]
        col = list(df.columns.values)[j]
        val = df.iloc[i,j]
        row = [ind, col, i+1, j+1, val]
        long_rows.append(row)

new_df = pd.DataFrame(long_rows, columns=["Col1", "Col2", "Row1", "Row2", "Value"])

和结果:

new_df
    Col1    Col2    Row1    Row2    Value
0   A       A       1       1       1
1   A       B       1       2       2
2   A       C       1       3       3
3   B       A       2       1       1
4   B       B       2       2       2
5   B       C       2       3       3
6   C       A       3       1       1
7   C       B       3       2       2
8   C       C       3       3       3

答案 1 :(得分:1)

创建数据并取消堆积值

df = pd.DataFrame({'A': [0.1, 0.1, 0.1],
                   'B': [0.2, 0.2, 0.2],
                   'C': [0.3, 0.3, 0.3]}, 
                   index=['A', 'B', 'C'])
mapping = {col: idx for idx, col in enumerate(df.columns, 1)}
df = df.unstack().to_frame().reset_index()
df.columns = ['Col1', 'Col2', 'Value']

DataFrame

>>> df

    Col1  Col2  Value
0   A     A     0.1
1   A     B     0.1
2   A     C     0.1
3   B     A     0.2
4   B     B     0.2
5   B     C     0.2
6   C     A     0.3
7   C     B     0.3
8   C     C     0.3

映射剩余值

>>> df.assign(
        Row_num=df['Col1'].map(mapping),
        Col_num=df['Col2'].map(mapping)
    )

输出

    Col1  Col2  Value Row_num Col_num
0   A     A     0.1   1    1
1   A     B     0.1   1    2
2   A     C     0.1   1    3
3   B     A     0.2   2    1
4   B     B     0.2   2    2
5   B     C     0.2   2    3
6   C     A     0.3   3    1
7   C     B     0.3   3    2
8   C     C     0.3   3    3