如何将子功能应用于语料库或文件夹?

时间:2015-04-27 13:43:21

标签: r

myDocument <- file.path(".", "politics")
myDocument;
text.corp <- Corpus(DirSource(myDocument))
text.corp;

我想使用包含1000个文件的politics目录中的子函数删除一些模式。子函数仅适用于文本文件,因此我无法在目录中进行操作。请帮帮我。

1 个答案:

答案 0 :(得分:2)

你应该使用这样的函数tm_map

text.corp.subed <- tm_map(text.corp, function(x) sub("Pattern", "Replacement", x))

您可以从中获取有关tm软件包使用情况的详细信息:http://cran.r-project.org/web/packages/tm/tm.pdf