我是Python的新手,我想重塑数据结构以进行进一步的分析。我想调整表格的形状,以便每个ID仅能有一行。我读到一些图书馆可以做到这一点,但我不知道怎么做。
所附示例的代码如下:
import pandas as pd
data = {'ID': [123, 123], 'Method': ['angular', 'angular'], 'Colour': ['red', 'blue'] }
df = pd.DataFrame (data, columns = ['ID','Method','Colour'])
df
每一个帮助将不胜感激
预先感谢
答案 0 :(得分:0)
unstack
是您进行这种重塑的朋友。可能的代码可能是:
resul = df.reset_index().set_index(['ID', 'Method', 'index']
).unstack().reset_index()
# clean up the column names
resul.columns = [i if j == '' else i + '_' + str(j)
for i, j in resul.columns.tolist()]
它给出了预期的结果:
ID Method Colour_0 Colour_1
0 123 angular red blue