通过TwitteR在推文中剥离换行符

时间:2018-01-17 23:51:05

标签: r twitter twitter-oauth

我需要帮助从我使用R语言和twitteR包提取的推文中删除换行符。这是我一直在使用的代码:

library(twitteR)
library(ROAuth)

consumer_key =''
consumer_secret = ''
access_token = ''
access_secret = ''

setup_twitter_oauth(consumer_key, consumer_secret, access_token,access_secret)
extracted_tweets2 = searchTwitter("'testword'", n=100000, lang="pt", retryOnRateLimit=120, since="2017-11-15", until="2018-01-17")

df <- do.call("rbind", lapply(extracted_tweets2, as.data.frame))
write.table(df,file="tweets1.csv", sep=";")

它以.csv格式返回以下示例:

    1;Tweet text;rest of data
    2;Other tweet text;rest of data
    3;line 
separated 
tweet text;rest of data
    4;Other tweet text;rest of data

this question类似,我想删除推文3中的换行符。

提前感谢!

1 个答案:

答案 0 :(得分:0)

假设您所指的换行符只是回车符和换行符(即。\ r \ n),并且您想从df $ text列中删除它们,那么,

df <- do.call("rbind", lapply(extracted_tweets2, as.data.frame))
df$text <- gsub("[\r\n]","", df$text)

顺便说一句,twitteR具有twListToDF函数,可以整齐地处理你在do.call上做的事情。尝试:

df <- twListToDF(extracted_tweets2)