我正在尝试使用R中的grep()函数来分析来自推文的数据,但是当我尝试搜索我知道存在于推文中的关键字时,grep()返回“integer(0)”。
所以我使用searchTwitter()函数创建列表:
NC.monday <- searchTwitter("UNC", n = 5000, since = "2015-11-30", until = "2015-12-01")
NC.monday <- unlist(NC.monday)
所以我有一个包含5000条推文的列表,这些推文都包含存储在名为NC.monday的对象中的“UNC”。以下是5000列表中的一个示例推文,索引4977:
[[4977]]
[1] "User1: RT @ESPNAndyKatz: UNC's Marcus Paige will play against Maryland in ACC-Big Ten Challenge https://t.co/devMeNiHct"
我可以看到,当我浏览推文时,一些推文包含单词“Paige”,但是当我使用grep()函数搜索它们时,它返回“integer(0)”
>grep("Paige", NC.monday)
integer(0)
我知道“Paige”这个词位于其中一些推文中,为什么grep()不会显示我们的位置?
答案 0 :(得分:0)
尝试将推文列表转换为数据框,并过滤包含推文的名为“text”的数据框列:
NC.monday.df <- twitteR::twListToDF(NC.monday)
NC.monday.df.filtered <- NC.monday.df[grepl("Paige", NC.monday.df$text, ignore.case=TRUE),]
并查看R如何执行索引。