我正在使用我的python脚本和Tweepy来收集推文并仅提取文本部分。我以txt格式保存了这些推文中的所有文本。
我现在正在尝试在R中加载此文本以使用此模块进行文本分析(http://rpubs.com/gogamza/ko_text_mining)但是,此R模块只接受.Rdata文件,我不知何故需要将我的推文集合提供给R. / p>
R代码说:
library(twitteR)
# n <- 200
#
# keyword <- '삼성전자'
#
# keyword <- enc2utf8(keyword)
#
# rdmTweets <- searchTwitter(keyword, n)
load(url("http://dl.dropbox.com/u/8686172/twitter.RData"))
nDocs <- length(rdmTweets)
所以,在load命令中,我想在那里添加我自己的文本文件 有人可以给我一个提示吗?非常感谢..我非常感激。
答案 0 :(得分:0)
您可以在R中的txt文件中加载数据并将其另存为RData文件:
sapply(list.files("/folderWithFiles", pattern="*.txt", full.names = TRUE),
function(x) { myDataInVector = scan(x, what=character()); save(myDataInVector, file=gsub("\\.txt","\\.RData",x)) } )
部分scan(x, what=character())
中的阅读假定您在文本文件中将所有数据都作为空格分隔的向量。如果扫描命令采用不同的格式,您可以使用read.table或更改扫描命令的参数。