我有pandas数据框,其中有两列-ID和与ID关联的项目:
id item
1 apple
2 banana
2 apple
3 avocado
(有重复的ID)
并希望将其转换为这样的表:
id apple banana avocado
------------------------
1 1 0 0
2 1 1 0
3 0 0 1
我以为Pandas Pivot或Pivot Table就是这样做的,但是尝试这些功能时并没有得到预期的结果。 到目前为止,我已经尝试过
df.pivot(index="id", columns="items") # gives ValueError: Index contains duplicate entries, cannot reshape
df.pivot_table(index="id", columns="items", aggfunc='count') # gives an empty dataframe
我该怎么做才能达到预期的效果?