Grep函数从列表

时间:2015-12-06 20:50:49

标签: r list twitter

我正在尝试使用R中的grep()函数来分析来自推文的数据,但是当我尝试搜索我知道存在于推文中的关键字时,grep()返回“integer(0)”。

所以我使用searchTwitter()函数创建列表:

NC.monday <- searchTwitter("UNC", n = 5000, since = "2015-11-30", until = "2015-12-01")
NC.monday <- unlist(NC.monday)

所以我有一个包含5000条推文的列表,这些推文都包含存储在名为NC.monday的对象中的“UNC”。以下是5000列表中的一个示例推文,索引4977:

[[4977]]
[1] "User1: RT @ESPNAndyKatz: UNC's Marcus Paige will play against Maryland in ACC-Big Ten Challenge https://t.co/devMeNiHct"

我可以看到,当我浏览推文时,一些推文包含单词“Paige”,但是当我使用grep()函数搜索它们时,它返回“integer(0)”

>grep("Paige", NC.monday)
integer(0)

我知道“Paige”这个词位于其中一些推文中,为什么grep()不会显示我们的位置?

1 个答案:

答案 0 :(得分:0)

尝试将推文列表转换为数据框,并过滤包含推文的名为“text”的数据框列:

NC.monday.df <- twitteR::twListToDF(NC.monday)
NC.monday.df.filtered <- NC.monday.df[grepl("Paige", NC.monday.df$text, ignore.case=TRUE),]

并查看R如何执行索引。