如何使用pandas透视此数据框

时间:2013-10-13 16:57:29

标签: python pandas

我正在尝试将此DataFrame转换为'a':

  algoasdaa      rc      rmse
0       asa   20-50  0.585161
1       asa  20-100  0.462159
2       asa  40-100  2.664910
3       asa  60-200  3.957400
4       asa  60-300  3.799590
5      lorl   20-50  0.696916
6      lorl  20-100  0.456810
7      lorl  40-100  2.489900
8      lorl  60-200  4.004530
9      lorl  60-300  3.736500

通过调用pivot方法

a.pivot('rc', 'algoasdaa', 'rmse')

但我一直收到错误

KeyError: 'no item named rmse'

即使此案例看起来与docs

中描述的案例完全相同

提前致谢!

1 个答案:

答案 0 :(得分:1)

这应该有用,对我有用:

>>> df.pivot("rc", "algoasdaa", "rmse")
algoasdaa       asa      lorl
rc                           
20-100     0.462159  0.456810
20-50      0.585161  0.696916
40-100     2.664910  2.489900
60-200     3.957400  4.004530
60-300     3.799590  3.736500

我怀疑你的rmse列名称有一些你看不到的空格。例如,如果我添加一个空格,它看起来是一样的:

>>> df.columns = ["rc", "algoasdaa", " rmse"]
>>> df
     rc algoasdaa      rmse
0   asa     20-50  0.585161
1   asa    20-100  0.462159
2   asa    40-100  2.664910
3   asa    60-200  3.957400
4   asa    60-300  3.799590
5  lorl     20-50  0.696916
6  lorl    20-100  0.456810
7  lorl    40-100  2.489900
8  lorl    60-200  4.004530
9  lorl    60-300  3.736500

但:

>>> df.pivot("rc", "algoasdaa", "rmse")
Traceback (most recent call last):
[...]
KeyError: u'no item named rmse'

尝试

>>> print df.columns
Index([u'rc', u'algoasdaa', u' rmse'], dtype=object)

确认这一点。然后,您可以修复您的读取操作(最好),也可以在事后用

修补它们
>>> df.columns = [col.strip() for col in df.columns]

>>> df.columns = pd.Series(df.columns).str.strip()