我正在处理两个数据框,其中包含来自两个不同帐户的推文数据。第一个数据框正在这个Twitter帐户上工作,并在我的R控制台中返回一个数据框。
baudet_tweets <- userTimeline("thierrybaudet", n = 3200, includeRts = TRUE)
baudet_tweets_df <- tbl_df(map_df(baudet_tweets, as.data.frame))
但是,不同Twitter帐户的相同代码会给我错误:
klaver_tweets <- userTimeline("jesseklaver", n = 3200, includeRts = TRUE)
klaver_tweets_df <- tbl_df(map_df(klaver_tweets, as.data.frame))
Error in rep(space, max_width) : invalid 'times' argument
我认为它是文本列,因为当我过滤掉select(klaver_tweets_df, text)
代码有效的文本列时。但我需要text
列进行文本分析...我发现奇怪的是text
baudet_tweets_df
列才有效。我的代码不是真正可重复的,但这里是df的图像,因为我可以View(klaver_tweets_df). Maybe only
klaver_tweets_df`包含表情符号?如果是这样,我怎么能删除它们?
答案 0 :(得分:1)
删除表情符号就可以了!
klaver_tweets_df$text <- gsub("[^\x01-\x7F]", "", klaver_tweets_df$text)