R文本挖掘包通过修改或删除现有文档来更新语料库

时间:2012-12-09 15:24:16

标签: r text text-mining

我想通过做一些简单的事情来修改由语料库索引的现有文档

myCorpus[[10]] = "hey I am the new content of this document"

这有效吗?

1 个答案:

答案 0 :(得分:3)

目前尚不清楚你想对你的语料库做什么。附加你的语料库或修改第10个元素?

我想说,作为一种语法,它是正确的,但语义是错误的。

从概念上讲,语料库是元数据和TextDocument列表。所以, 您可以使用' [['或者使用' $'。

所以如果你这样做(最好使用< - than = even就在这里它们是等价的)

myCorpus[[10]] <- "hey I am the new content of this document" 

这将创建或更改第10个元素,但使用类字符的元素而不是 TextDocument 。因此,您无法在类

上应用使用方法

所以要更新10个文本文档的内容:

Content(myCorpus[[10]]) <- "hey I am the new content of this document" 

要创建新元素,请使用:

tmUpdate(ovid, DirSource(txt))

检查源是否存在文档集中尚不存在的新文件。 被解析并添加到现有文档集合中。