Question

我有一个来自IMDB的数据框，看起来像这样。不幸的是，它没有分组，但我希望可以将R分组。

数据如下：

V1                  V2              starts_with
NM: Aarons          Alex            NM
DB: 15 May 1890     Philadelphia    DB
NM: Aarons          Leroy           NM
NM: Aarons          Shawn           NM
DB: 26 March 1989   Jamaica         DB

我想要添加一个新列。基于NM＆DB组合的序列。每次有一个新的“ NM”都会有一个新的数字：

V1                  V2              starts_with     group
NM: Aarons          Alex            NM              1
DB: 15 May 1890     Philadelphia    DB              1
NM: Aarons          Leroy           NM              2
NM: Aarons          Shawn           NM              3
DB: 26 March 1989   Jamaica         DB              3

我当然搜索了SO，并看到了这个generate sequence within group in R，但是该示例已被分组。不幸的是，我的数据没有分组。

Answer 1

您可以使用cumsum：

df$group = cumsum(df$starts_with == "NM")

R：按行顺序分组

1 个答案: