Question

我正在尝试使用R中的grep（）函数来分析来自推文的数据，但是当我尝试搜索我知道存在于推文中的关键字时，grep（）返回“integer（0）”。

所以我使用searchTwitter（）函数创建列表：

NC.monday <- searchTwitter("UNC", n = 5000, since = "2015-11-30", until = "2015-12-01")
NC.monday <- unlist(NC.monday)

所以我有一个包含5000条推文的列表，这些推文都包含存储在名为NC.monday的对象中的“UNC”。以下是5000列表中的一个示例推文，索引4977：

[[4977]]
[1] "User1: RT @ESPNAndyKatz: UNC's Marcus Paige will play against Maryland in ACC-Big Ten Challenge https://t.co/devMeNiHct"

我可以看到，当我浏览推文时，一些推文包含单词“Paige”，但是当我使用grep（）函数搜索它们时，它返回“integer（0）”

>grep("Paige", NC.monday)
integer(0)

我知道“Paige”这个词位于其中一些推文中，为什么grep（）不会显示我们的位置？

Answer 1

尝试将推文列表转换为数据框，并过滤包含推文的名为“text”的数据框列：

NC.monday.df <- twitteR::twListToDF(NC.monday)
NC.monday.df.filtered <- NC.monday.df[grepl("Paige", NC.monday.df$text, ignore.case=TRUE),]

并查看R如何执行索引。