我有一个带有这样的列的数据框-
Name Id 2019col1 2019col2 2019col3 2020col1 2020col2 2020col3 2021col1 2021Ccol2 2021Ccol3
即,每年重复列。 我想把年份抽成一列,以便最终数据框看起来像-
Name Id Year col1 col2 col3
大熊猫有办法实现这种目标吗?
答案 0 :(得分:3)
使用wide_to_long
,但在将订单年份更改为列表理解中将列名从2019col1
更改为col12019
的结尾之前:
print (df)
Name Id 2019col1 2019col2 2019col3 2020col1 2020col2 2020col3 \
0 a 456 4 5 6 2 3 4
2021col1 2021col2 2021col3
0 5 2 1
df.columns = [x[4:] + x[:4] if x[:4].isnumeric() else x for x in df.columns]
df = (pd.wide_to_long(df.reset_index(),
['col1','col2', 'col3'],
i='index',
j='Year').reset_index(level=0, drop=True).reset_index())
print (df)
Year Id Name col1 col2 col3
0 2019 456 a 4 5 6
1 2020 456 a 2 3 4
2 2021 456 a 5 2 1