如何在Apache Ruta中将参数dictRemoveWS设置为true

时间:2018-03-06 06:00:42

标签: apache ruta

class Foo { private: int numbers[100]; public: int& operator[](const int &pos) { return const_cast<int&>(static_cast<const Foo&>(*this)[pos]); } const int& operator[](const int &pos) const { return numbers[pos]; } }; 与Wordlist相关。我想删除自定义ruta脚本中的空白问题,从txt文件中获取wordlist。

文档说明使用dictRemoveWS方法,并使用以下示例:

CONFIGURE 但我仍然无法将ENGINE utils.HtmlAnnotator; Document{->CONFIGURE(HtmlAnnotator, "onlyContent" = false)}; 参数设置为true

1 个答案:

答案 0 :(得分:1)

可以在引擎配置上配置这样的参数:

在Java中:

AnalysisEngineFactory.createEngine(RutaEngine.class, typeSystemDescription,
                RutaEngine.PARAM_SCRIPT_PATHS, scriptsPath,
                RutaEngine.PARAM_RESOURCE_PATHS, resourcesPath,
                RutaEngine.PARAM_MAIN_SCRIPT, "Main",
                RutaEngine.PARAM_DICT_REMOVE_WS, true)

或在XML定义中:

https://github.com/apache/uima-ruta/blob/trunk/example-projects/ExampleProject/descriptor/BasicEngine.xml

有关更多信息,请参阅Ruta文档: https://uima.apache.org/d/ruta-current/tools.ruta.book.html#ugr.tools.ruta.ae.basic