我使用groupby和sum创建了以下数据框:-
year_month Country
2008-01 Afghanistan 2
Albania 3
Argentina 4
2008-02 Afghanistan 3
Albania 4
Argentina 5
我需要拆开包装,并希望将名称重命名为der_value_Afghanistan,der_value_Albania等作为列名,而不是阿富汗等。既然可能是100个或更多,那么有什么办法可以全部重命名而不是手动重命名?
year_month der_value_Afghanistan der_value_Albania der_value_Argentina
答案 0 :(得分:4)
我认为需要Series.unstack
和DataFrame.add_prefix
:
df = s.unstack().add_prefix('der_value_')
print (df)
Country der_value_Afghanistan der_value_Albania der_value_Argentina
year_month
2008-01 2 3 4
2008-02 3 4 5
要在index
列中添加DataFrame.rename_axis
和DataFrame.reset_index
:
df = s.unstack().add_prefix('der_value_').rename_axis(None, axis=1).reset_index()
print (df)
year_month der_value_Afghanistan der_value_Albania der_value_Argentina
0 2008-01 2 3 4
1 2008-02 3 4 5
MultiIndex.from_arrays
也可以在MultiInex
之前修改unstack
:
a = s.index.get_level_values(0)
b = 'der_value_' + s.index.get_level_values(1)
s.index = pd.MultiIndex.from_arrays([a, b], names=s.index.names)
print (s)
year_month Country
2008-01 der_value_Afghanistan 2
der_value_Albania 3
der_value_Argentina 4
2008-02 der_value_Afghanistan 3
der_value_Albania 4
der_value_Argentina 5
Name: a, dtype: int64
df = s.unstack()
print (df)
Country der_value_Afghanistan der_value_Albania der_value_Argentina
year_month
2008-01 2 3 4
2008-02 3 4 5
答案 1 :(得分:2)
idx, cols = s.index.levels
i, j = s.index.labels
v = np.zeros((len(idx), len(cols)), dtype=s.dtype)
v[i, j] = s
pd.DataFrame(
np.column_stack([idx, v]),
columns=np.append('year_month', 'der_value_' + cols)
)
year_month der_value_Afghanistan der_value_Albania der_value_Argentina
0 2008-01 2 3 4
1 2008-02 3 4 5