我有一个df试图将其非正规化。基本上,我想将'inst-cap-c'
,'cap-lo-c'
等参数值更改为列。
为此,pandas lib中有2种方法。我和他们两个都遇到了一些问题,无法对这个df进行非规范化处理。
df如下所示(为简单起见...):
data
Site Storage Commodity parameter value
0 Mid Pump Elec inst-cap-c 0
1 Mid Pump Elec cap-lo-c 0
2 Mid Pump Elec cap-up-c 1.5e+15
3 Mid Pump Elec inst-cap-p 0
4 Mid Pump Elec cap-lo-p 0
...
52 South Pump Elec wacc 0.07
53 South Pump Elec depreciation 50
54 South Pump Elec init 1
55 South Pump Elec discharge 3.5e-06
56 South Pump Elec ep-ratio None
当我尝试通过以下方式创建具有参数值的列
data.pivot_table(values='value',
index=['Site', 'Storage', 'Commodity'],
columns='parameter')
它只是说:*** pandas.core.base.DataError: No numeric types to aggregate
我猜这是因为None
的{{1}}值,我不能在ep-ratio
上使用NaN
,因为它产生了其他问题。
那么我该如何对该数据帧进行非规范化?
预期结果:
None
额外:
data
Site Storage Commodity inst-cap-c cap-lo-c cap-up-c ... ep-ratio
0 Mid Pump Elec 0 0 1.5e+15 ... None
1 North Pump Elec 0 0 1.5e+15 ... None
2 South Pump Elec 0 0 1.5e+15 ... None
我也对此进行了检查:pivot_table No numeric types to aggregate并没有帮助
答案 0 :(得分:1)
您已接近,需要将parameter
列添加到列表中,在unstack
之前选择列value
,最后将reset_index
与rename_axis
一起使用以进行数据清理:< / p>
df = (data.set_index(['Site', 'Storage','Commodity','parameter'])['value']
.unstack()
.reset_index()
.rename_axis(None, axis=1))
print (df)
Site Storage Commodity cap-lo-c cap-lo-p cap-up-c depreciation discharge \
0 Mid Pump Elec 0 0 1.5e+15 NaN NaN
1 South Pump Elec NaN NaN NaN 50 3.5e-06
ep-ratio init inst-cap-c inst-cap-p wacc
0 NaN NaN 0 0 NaN
1 None 1 NaN NaN 0.07