如何在jajatr库中设置语料库的路径

时间:2015-05-25 13:15:08

标签: java

我有一个文本文件,我想使用jajatr库执行自动术语识别。如何在此库中设置文件的路径。该库将处理文本文件并生成包含结果的输出文件。

我已从下面提供的网址下载此库

< https://code.google.com/p/jajatr/downloads/list>

我研究过,发现这个东西很有用

解压缩下载文件夹后。遍历下面提供的文件夹

jajatr \ jajatr \ SRC \ jatr \ SRC

将找到名为 jatr

的属性文件

现在在名为 jatr 的文件中设置文本文件路径。

此文件中的一个陈述是:

jatr.system.refcorpus =的/ mnt / minerva1 / NLP /语料库/单语/英语/ gigaword / gw.lemmas.unigram_counts

我想我必须在 jatr.properties 文件中设置语料库路径 但我不知道如何设置我的语料库的路径。

运行TestCValue.java类

之后

输出

用法:java TestTfIdf [path_to_corpus]

1 个答案:

答案 0 :(得分:0)

您无需更改jar文件的jatr.properties目录中的src文件。当您通过命令行运行jar时,您可以提供您感兴趣的属性,例如:

java -jar jajatr.jar -Djatr.system.refcorpus=%YOUR-PATH%