JCas类型... Timex3 ...用于Java代码,但未在XML类型描述符heideltime

时间:2019-05-15 12:40:35

标签: java nlp uima uimafit heideltime

我使用gradle配置了heidelTime。我正在获取值,但是无法遍历字符串结果。

result = heidelTime.process(sentence, new Date());
JCas cas = JCasFactory.createJCas();
FSIterator it = cas.getAnnotationIndex(Timex3.type).iterator(); // Here I am getting error

错误是由于 JCasImpl.class-> TOP_Type getType(int i)

if (this.casImpl.getTypeSystem().getType(typeName) == null) {
            // no - report error that JCAS type was not defined in XML
            // descriptor
            CASRuntimeException casEx = new CASRuntimeException(
                CASRuntimeException.JCAS_TYPE_NOT_IN_CAS, new String[] { typeName });
            throw casEx;
          }

我检查了github项目,发现其中的HeidelTime_TypeSystem.xml文件定义了类型System。

版本配置

compile group: 'com.github.heideltime', name: 'heideltime', version: '2.2.1'
compile group: 'org.apache.uima', name: 'uimaj-core', version: '2.3.1'

堆栈跟踪

org.apache.uima.cas.CASRuntimeException: JCas type de.unihd.dbs.uima.types.heideltime.Timex3" used in Java code,  but was not declared in the XML type descriptor.
            at org.apache.uima.jcas.impl.JCasImpl.getType(JCasImpl.java:412) ~[uimaj-core-2.3.1.jar:2.3.1]
            at org.apache.uima.jcas.impl.JCasImpl.getCasType(JCasImpl.java:436) ~[uimaj-core-2.3.1.jar:2.3.1]
            at org.apache.uima.jcas.impl.JCasImpl.getAnnotationIndex(JCasImpl.java:1531) ~[uimaj-core-2.3.1.jar:2.3.1]

是否需要手动添加任何文件才能使其正常工作?

types.txt文件位置

enter image description here

1 个答案:

答案 0 :(得分:0)

在使用UIMA类型的JCas类而未为此类型配置CAS时会发生这种情况。

致电

JCas cas = JCasFactory.createJCas();

扫描类路径以查找types.txt下的META-INF/org.apache.uima.fit/文件(因此,一个名为META-INF的文件夹带有一个名为org.apache.uima.fit的子文件夹,然后包含types.txt文件)并加载其中引用的所有UIMA类型描述符。示例types.txt文件如下所示:

classpath*:org/apache/uima/fit/type/Token.xml

这告诉uimaFIT加载位于程序包Token.xml中的类型描述符文件org.apache.uima.fit.type(替换为您自己的程序包和文件名)。

请注意,如果您使用Maven,则所有这些文件和文件夹通常必须位于src/main/resources下(而不是src/main/java下)。根据您设置Gradle的方式,这可能同样适用于您。

uimaFIT的类型自动检测在uimaFIT documentation中也有更详细的描述。

因此,对于您的特定情况:尝试将desc/type/HeidelTime_TypeSystem.xml放入src/main/resources/desc/type/HeidelTime_TypeSystem.xml,并创建内容为src/main/resources/META-INF/org.apache.uima.fit/types.txt的{​​{1}}文件。

注意:在撰写本文时,我是Apache uimaFIT的维护者。