Vcorpus Rstudio结合.txt文件

时间:2017-03-26 15:51:58

标签: r

我有一个.txt文件目录,需要将它们合并到一个文件中。每个文件都是一个单独的行。我试过了:

new_corpus <-VCorpus(DirSource("Downloads/data/"))

数据在文件中但我收到错误

Error in DirSource(directory = "Downloads/data/") : 
empty directory

这有点基础,但我只获得了有关如何创建语料库的信息。我需要做的是获取此文件并创建一个因子,即.txt和另一个具有ID的因素,形式为:

ID .txt
ID .txt
.......

编辑澄清emilliman5评论: 我需要一个数据框和一个语料库。我正在使用的示例使用了一个csv文件,其数据已标记为朴素贝叶斯问题。我可以通过这个例子和所有步骤。我的数据采用不同的格式。这是短.txt文件的2个目录(/ ham和/ spam)。当我将命令改为:

时,我能够创建一个语料库
  

new_corpus&lt; -VCorpus(DirSource(“〜/ Downloads / data /”))

我已经清理了原始数据并可以制作DTM,但最后我需要创建一个标签为spam和ham的crossTable。我不明白我是如何将这些信息插入语料库的。

0 个答案:

没有答案