我有一个.txt文件目录,需要将它们合并到一个文件中。每个文件都是一个单独的行。我试过了:
new_corpus <-VCorpus(DirSource("Downloads/data/"))
数据在文件中但我收到错误
Error in DirSource(directory = "Downloads/data/") :
empty directory
这有点基础,但我只获得了有关如何创建语料库的信息。我需要做的是获取此文件并创建一个因子,即.txt和另一个具有ID的因素,形式为:
ID .txt
ID .txt
.......
编辑澄清emilliman5评论: 我需要一个数据框和一个语料库。我正在使用的示例使用了一个csv文件,其数据已标记为朴素贝叶斯问题。我可以通过这个例子和所有步骤。我的数据采用不同的格式。这是短.txt文件的2个目录(/ ham和/ spam)。当我将命令改为:
时,我能够创建一个语料库new_corpus&lt; -VCorpus(DirSource(“〜/ Downloads / data /”))
我已经清理了原始数据并可以制作DTM,但最后我需要创建一个标签为spam和ham的crossTable。我不明白我是如何将这些信息插入语料库的。