使用twitterR捕获的推文会在data.frame中生成编码错误

时间:2016-06-05 08:52:07

标签: json r twitter

我有一个文件,其中包含使用twitteR库

捕获的推文
library("stringi")
library("rjson")


json_data <- lapply(readLines("tweets.json",-1L, warn=FALSE, encoding = "UTF-8"), function(x) fromJSON(x, unexpected.escape = "skip"))
text <- sapply(json_data, function(x) x$text)
df <- data.frame(text)
summary(df)

生成此错误:

Error in data.frame("RT @ (.....)  \xed\xa0\xbd\xed\xb4\xa5\xed\xa0\xbd\xed\xb2\xa5 https://",  : 
  arguments imply differing number of rows: 1, 0

我如何跳过此错误?

1 个答案:

答案 0 :(得分:1)

问题在于存在各种属性,称为&#34; text&#34;因为可以回复推文,RT等,并在同一条推文中存储有关推文,RT等的所有信息