我有一个太多的紧凑型数据框"形成。 DataFrame目前是这样的:
> import numpy as np
> import pandas as pd
> df = pd.DataFrame({'foo': ['A','B'],
'bar': ['1', '2'],
'baz': [np.nan, '3']})
bar baz foo
0 1 NaN A
1 2 3 B
我需要"卸下"它是这样的:
> df = pd.DataFrame({'foo': ['A','B', 'B'],
'type': ['bar', 'bar', 'baz'],
'value': ['1', '2', '3']})
foo type value
0 A bar 1
1 B bar 2
2 B baz 3
无论我如何试图转动,我都无法做到正确。
答案 0 :(得分:4)
使用melt()方法:
In [39]: pd.melt(df, id_vars='foo', value_vars=['bar','baz'], var_name='type')
Out[39]:
foo type value
0 A bar 1
1 B bar 2
2 A baz NaN
3 B baz 3
或
In [38]: pd.melt(df, id_vars='foo', value_vars=['bar','baz'], var_name='type').dropna()
Out[38]:
foo type value
0 A bar 1
1 B bar 2
3 B baz 3
答案 1 :(得分:3)
将索引设置为foo,然后堆叠:
df.set_index('foo').stack()
foo
A bar 1
B bar 2
baz 3
dtype: object