数据帧small_df看起来像这样:
> smaller_df.head()
MSA Code Line RPP
0 10180 1.0 91.2
1 10180 2.0 97.4
2 10180 3.0 78.7
3 10180 4.0 93.5
4 10420 1.0 90.4
...
wage_keys.head()给出:
MSA Code Average Wage
0 11260 94490.000000
1 21820 72080.000000
2 10180 71128.571429
3 13820 87338.396624
4 10420 76620.000000
...
请注意,相同的“ MSA代码”在small_df中可以出现多次,而在工资密钥中则只能出现一次。
MSA Code Line RPP Wages
0 10180 1.0 91.2 71128.571429
1 10180 2.0 97.4 71128.571429
2 10180 3.0 78.7 71128.571429
3 10180 4.0 93.5 71128.571429
4 10420 1.0 90.4 76620.000000
...
我有以下代码通过绘制工资字典来进行映射:
flat_df = smaller_df.pivot(index='MSA Code', columns='Line')['RPP']
问题是我丢了专栏!我的索引列成为行标签。
Line 1.0 2.0 3.0 4.0
MSA Code
10180 91.2 97.4 78.7 93.5
10420 90.4 95.8 77.4 91.8
10500 82.7 97.2 54.0 93.5
10540 94.6 100.1 87.4 93.4
10580 100.6 98.1 103.4 101.8
我尝试了许多不同的方法,但都没有达到我想要的效果。 如何获得将MSA代码保留为第一列而不是将其转换为行标签的枢纽?