在DKPro中更改可重用管道中的文本

时间:2016-06-12 05:29:33

标签: java uima dkpro-core

This questions描述了如何在dkpro中重用管道但是如果我只创建一个JCas然后尝试更改文本然后我得到异常

org.apache.uima.cas.CASRuntimeException: Data for Sofa feature setLocalSofaData() has already been set.

我如何解决这个问题?

1 个答案:

答案 0 :(得分:2)

CAS中的沙发数据只能设置一次。设置后无法修改。

要重新使用CAS,请在其上调用reset()方法。这会清除所有注释,并允许您再次设置沙发/文本。

要逐步构建CAS,常见的策略是向CAS添加注​​释,同时将文本添加到字符串缓冲区并仅在流程结束时设置文本。

基于uimaFIT的示例可能如下所示:

Strings[] texts = {
    "Hello world.",
    "This is a test." };

// Create empty CAS/JCas initialized using uimaFIT typesystem auto-detection
JCas jcas = JCasFactory.createJCas();

// Instantiate some analysis engine
AnalysisEngine engine = AnalysisEngineFactory.createEngine(...);

// Process texts re-using the previously created CAS/JCas instance
for (String t : texts) {
    jcas.reset();
    jcas.setDocumentText(t);
    jcas.setDocumentLanguage("en");
    engine.process(jcas);
}

engine.collectionProcessComplete();
engine.destroy();

披露:我正在开发Apache UIMA项目。