我有一个来自IMDB的数据框,看起来像这样。不幸的是,它没有分组,但我希望可以将R分组。
数据如下:
V1 V2 starts_with
NM: Aarons Alex NM
DB: 15 May 1890 Philadelphia DB
NM: Aarons Leroy NM
NM: Aarons Shawn NM
DB: 26 March 1989 Jamaica DB
我想要添加一个新列。基于NM&DB组合的序列。每次有一个新的“ NM”都会有一个新的数字:
V1 V2 starts_with group
NM: Aarons Alex NM 1
DB: 15 May 1890 Philadelphia DB 1
NM: Aarons Leroy NM 2
NM: Aarons Shawn NM 3
DB: 26 March 1989 Jamaica DB 3
我当然搜索了SO,并看到了这个generate sequence within group in R,但是该示例已被分组。不幸的是,我的数据没有分组。
答案 0 :(得分:1)
您可以使用cumsum
:
df$group = cumsum(df$starts_with == "NM")