我有这个pandas数据框:
df = DataFrame({'B' : ('A','B','C','D','E','F','G'), 'C' : (1,3,5,6,8,2,5), 'D' : (5,2,6,9,3,7,3)})
B C D
0 A 1 5
1 B 3 2
2 C 5 6
3 D 6 9
4 E 8 3
5 F 2 7
6 G 5 3
我需要让计算变得更好。对我来说方便的格式是:
B description value
0 A C 1
1 B C 3
2 C C 5
3 D C 6
4 E C 8
5 F C 2
6 G C 5
7 A D 5
8 B D 2
9 C D 6
10 D D 9
11 E D 3
12 F D 7
13 G D 3
有没有办法将列名用作值
答案 0 :(得分:6)
您可以使用方便的pd.melt
来查看@unutbu的答案。更通用的方法是使用stack
,但这需要更多的手动调整:
In [139]: df.set_index('B').stack().reset_index()
Out[139]:
B level_1 0
0 A C 1
1 A D 5
2 B C 3
3 B D 2
4 C C 5
5 C D 6
6 D C 6
7 D D 9
8 E C 8
9 E D 3
10 F C 2
11 F D 7
12 G C 5
13 G D 3
经过一些重命名和排序后:
In [150]: result = df.set_index('B').stack().reset_index()
In [151]: result = result.rename(columns={'level_1':'description', 0:'value'})
In [152]: result.sort(['description', 'B']).reset_index(drop=True)
Out[152]:
B description value
0 A C 1
1 B C 3
2 C C 5
3 D C 6
4 E C 8
5 F C 2
6 G C 5
7 A D 5
8 B D 2
9 C D 6
10 D D 9
11 E D 3
12 F D 7
13 G D 3
答案 1 :(得分:6)
您可以使用pd.melt
:
In [13]: pd.melt(df, id_vars=['B'], var_name='description')
Out[13]:
B description value
0 A C 1
1 B C 3
2 C C 5
3 D C 6
4 E C 8
5 F C 2
6 G C 5
7 A D 5
8 B D 2
9 C D 6
10 D D 9
11 E D 3
12 F D 7
13 G D 3