如何获取正常的数据帧,如下所示:
pd.DataFrame(columns=['X', 'Y'],index=['A','B'])
X Y
A 1 2
B 3 4
并生成一个新的数据框,其中的每一行都由单元格,列名和索引组成,如下所示:
col1 col2 col3
row0 1 X A
row1 2 Y A
row2 3 X B
row3 4 Y B
感谢您的帮助。
答案 0 :(得分:2)
使用DataFrame.stack
进行重塑,然后使用DataFrame.rename_axis
进行新列名称,将MultiIndex Series
的{{3}}更改为DataFrame
,必要时重命名索引并更改列的顺序由DataFrame.reset_index
:
df = (df.stack()
.rename_axis(('col3','col2'))
.reset_index(name='col1')
.rename(lambda x: f'row{x}')
.reindex(['col1','col2','col3'], axis=1))
print (df)
col1 col2 col3
row0 1 X A
row1 2 Y A
row2 3 X B
row3 4 Y B
Numpy / pandas解决方案-DataFrame.reindex
,numpy.ravel
,numpy.tile
和DataFrame
构造函数:
df = pd.DataFrame({'col1': df.to_numpy().ravel(),
'col2': np.tile(df.columns,len(df.index)),
'col3': np.repeat(df.index,len(df.columns))}).rename(lambda x: f'row{x}')
print (df)
col1 col2 col3
row0 1 X A
row1 2 Y A
row2 3 X B
row3 4 Y B