我有多行文件,每行代表我的方案的文档。我搜索了如何从中创建语料库并找到关于R tm包函数readPlain
但是将整个文本文件作为一个文档加载。我还找到了在R text file and text mining...how to load data加载文档的方法,但指定了采用文件夹路径的方法,并为其中的每个文件创建了一个文档。
如何为每个句子形成不同的文档。
答案 0 :(得分:0)
尝试readLines(" /path/to/yourfile.txt") 每行都是文本向量中的不同元素.Norines long,其中Nlines是文档中的行数。 否则,请参阅scan()。 如果需要,它们都有一个跳过选项,如果你想以块的形式读取它,则它们都有一个nlines选项。