我有一个名为df的熊猫df,具有数百万个观察值(行),只有4列。
我正在尝试将event_type列转换为几列,并为该列的每一行添加一个计数。
我的df看起来像这样:
event_type event_time organization_id user_id
0 Applied Saved View 2018-11-22 10:59:57.360 3 0
我正在寻找这个:
Applied_Saved_View event_time organization_id user_id
0 1 2018-11-22 10:59:57.360 3 0
答案 0 :(得分:0)
我相信您正在寻找一种叫做pd.get_dummies的东西。我假设您正在尝试制作此分类数据?没有样本数据,我无法进行测试,但请参见下面的代码。
df2 = pd.get_dummies(df['event_type'])
new_df = pd.concat([df2,df],axis=1)
我应该提到,您应该看到此事件类型列中有多少个唯一值,因为无论它们的10个还是100000个唯一值,这些值都会变成行