我有一个大的R Corpus对象,使用tm包,由数百万个小文档组成。
如何将其作为单个文本文件保存到磁盘以与其他程序(例如word2vec)一起使用?
我试过
writeCorpus(myCorpus)
但这写出了一百万个小文本文件,炸毁了我的Mac!
我对R不是很精通,所以对如何做到这一点的任何帮助都会非常感激。谢谢!
答案 0 :(得分:2)
尝试:
writeLines(as.character(mycorpus), con="mycorpus.txt")
但我不知道一百万份文件是否有效