myDocument <- file.path(".", "politics")
myDocument;
text.corp <- Corpus(DirSource(myDocument))
text.corp;
我想使用包含1000个文件的politics目录中的子函数删除一些模式。子函数仅适用于文本文件,因此我无法在目录中进行操作。请帮帮我。
答案 0 :(得分:2)
你应该使用这样的函数tm_map
:
text.corp.subed <- tm_map(text.corp, function(x) sub("Pattern", "Replacement", x))
您可以从中获取有关tm
软件包使用情况的详细信息:http://cran.r-project.org/web/packages/tm/tm.pdf