带有koRpus R包的树标记器的路径错误

时间:2015-12-10 20:53:54

标签: r windows path text-mining pos-tagger

我尝试使用我在R中用here安装的treeTagger和koRpus包。

library(koRpus)
tagged.results <- treetag(as.factor("salut ça va"), treetagger="manual", lang="fr", TT.options=list(path="C:\\TreeTagger\\bin\\tree-tagger.exe"))

生成以下错误:

Erreur dans path.expand(path) : argument 'path' incorrect

我不明白,因为我可以看到此路径中的所有文件,包括:tree-tagger和tree-tagger-flush(应用程序文件),tag-french和chunk-french这些是windows命令文件。

我也尝试过:

set.kRp.env(TT.cmd="C:\\TreeTagger\\bin\\tree-tagger.exe", lang="fr")
tagged.text <- treetag(as.factor("salut ça va"),lang="fr")

第二个产生相同的错误

1 个答案:

答案 0 :(得分:1)

这里有几个问题。首先,as.factor(&#34; salut ca va&#34;)应该是包含该文本的文件。您还错过了TT.options中的预设值。你会想要预置=&#34; fr&#34;在路径论证之后。最后,路径本身应该指向根目录。

文档here指出&#34; TT.options 用于配置如何调用TreeTagger的选项列表。您有两个基本选择:您可以选择一个预定义的预设,也可以提供一整套有效选项: path必需:TreeTagger根目录的绝对路径。这就是它的子文件夹bin,cmd和lib所在的位置。&#34;

您将bin目录中的path变量指向.exe文件。运行以下代码以指向bin目录所在的根目录,如下所示:

library(koRpus)
tagged.results <- treetag("test.txt", treetagger="manual", lang="fr", TT.options=list(path="C:\\TreeTagger", preset="fr"))