我有一个pandas数据帧,有4行和4列 - 这里是简单的版本:
import pandas as pd
import numpy as np
rows = np.arange(1, 4, 1)
values = np.arange(1, 17).reshape(4,4)
df = pd.DataFrame(values, index=rows, columns=['A', 'B', 'C', 'D'])
我要做的是将其转换为2 * 8数据帧,每个数组都有B,C和D alligng - 所以它看起来像这样:
1 2
1 3
1 4
5 6
5 7
5 8
9 10
9 11
9 12
13 14
13 15
13 16
阅读pandas文档我试过这个:
df1 = pd.pivot_table(df, rows = ['B', 'C', 'D'], cols = 'A')
但是给我一个错误,我无法识别来源(以
结尾)DataError:无聚合的数字类型
)
接下来我想基于A值拆分数据帧,但我认为.groupby命令可能会照顾它
答案 0 :(得分:6)
您正在寻找的是melt
功能
pd.melt(df,id_vars=['A'])
A variable value
0 1 B 2
1 5 B 6
2 9 B 10
3 13 B 14
4 1 C 3
5 5 C 7
6 9 C 11
7 13 C 15
8 1 D 4
9 5 D 8
10 9 D 12
11 13 D 16
然后需要根据A
进行最终排序
pd.melt(df,id_vars=['A']).sort('A')
A variable value
0 1 B 2
4 1 C 3
8 1 D 4
1 5 B 6
5 5 C 7
9 5 D 8
2 9 B 10
6 9 C 11
10 9 D 12
3 13 B 14
7 13 C 15
11 13 D 16
注意:pd.DataFrame.sort
has been deprecated支持pd.DataFrame.sort_values
。