提取R中两个符号之间的子字符串

时间:2018-10-25 11:14:53

标签: r regex dataframe gsub tweets

我正在尝试从数据框中的一组qouted转推中获取一个子字符串,该子字符串如下所示:

  

RT @fireengineering:#消防员受伤

对于我的TweetText列中的每一行,我想获取被转推的用户的ScreenName,即“ @”和“:”之间的字符串,并将它们添加到新列中。我试图在tidyverse中使用gsub和regex提取用户名,但效果不大:

FireExportF3 <- FireExport %>%
select(TweetID,ScreenName, TweetText) %>%
dplyr::filter(str_detect(TweetText, "RT"))

FireExportF3$QoutedUser <- FireExportF3 %>%
gsub("@([^;]*):", "\\1", TweetText)

数据框如下所示:

FireExportF3

当我运行该函数时,它还会显示:

Error in gsub(., "@([^;]*):", "\\1", TweetText) : 
object 'TweetText' not found

如果有人可以指出我的错误或提出其他建议,我将不胜感激。

0 个答案:

没有答案