连续计数每个观察值

时间:2019-07-17 18:52:41

标签: python pandas numpy format

我有一个名为df的熊猫df,具有数百万个观察值(行),只有4列。

我正在尝试将event_type列转换为几列,并为该列的每一行添加一个计数。

我的df看起来像这样:

    event_type            event_time       organization_id     user_id                 

0   Applied Saved View  2018-11-22 10:59:57.360    3            0

我正在寻找这个:

    Applied_Saved_View event_time              organization_id user_id
0       1              2018-11-22 10:59:57.360    3              0

1 个答案:

答案 0 :(得分:0)

我相信您正在寻找一种叫做pd.get_dummies的东西。我假设您正在尝试制作此分类数据?没有样本数据,我无法进行测试,但请参见下面的代码。

df2 = pd.get_dummies(df['event_type'])
new_df = pd.concat([df2,df],axis=1)

我应该提到,您应该看到此事件类型列中有多少个唯一值,因为无论它们的10个还是100000个唯一值,这些值都会变成行