我有一个使用R中的rtweet
包创建的数据库,其中包含一些公司Twitter历史记录的时间表和相应日期。格式如下:
created_at screen_name text
date1 firm1 string (140 chars)
date2 firm1 string (140 chars)
date3 firm1 string (140 chars)
date1 firm2 string (140 chars)
date2 firm2 string (140 chars)
date1 firm3 string (140 chars)
对于每家公司,我需要确定他们第一次发布text
列中的特定关键字并返回相应的日期。他们可能会在推文中多次发送该单词,因此找到第一个出现的单词很重要。
我尝试了with(df, ifelse(grepl(KEYWORD, text), !duplicated(created_at, fromLast = TRUE), NA))
和!duplicated(df$created_at[df$text == KEYWORD], fromLast = TRUE)
...都无济于事。
如果有人知道如何找到特定单词的第一个实例并返回相应的日期,将不胜感激。预先感谢。