如何使用R基于特定格式的单元格从数据框中删除行

时间:2014-08-01 18:07:10

标签: r csv twitter

所以我试图对Twitter Analytics上的.csv进行一些基本的分析。对于那些不知道的人,Twitter Analytics导出包含有关您帐户的所有帖子和@replies的信息。但是,我只想查看实际帖子的信息。没有列指定帖子是原件还是答复。帖子是回复的唯一信号是,在“推文文本”列中,它始终以“@”用户名开头。如何使用R从“推文文本”列中删除以@开头的.csv中的所有行?

1 个答案:

答案 0 :(得分:1)

您可以使用grep()执行此操作。

# sample data frame
df <- data.frame(text = c("Here's a tweet", 
                          "@user this is a reply", 
                          "another tweet", 
                          "@another reply"),
                 stringsAsFactors = FALSE)

# remove rows beginning with @
df[grep("^@", df$text, invert = TRUE), ]
# [1] "Here's a tweet" "another tweet"