如何在UIMA中访问文档元数据?

时间:2016-01-24 13:18:32

标签: metadata uima

如何使用UIMA和JCas访问文档元数据,如创建和修改日期或标题等?

1 个答案:

答案 0 :(得分:3)

默认情况下,此类信息在UIMA中不可用。

某些集合阅读器实现可能会将此类信息存储在DocumentAnnotation或其他专用注释的子类型中。例如。 DKPro Core定义了DocumentMetaData类型,该类型派生自DocumentAnnotation,DKPro Core读取器组件存储文档的原始路径/ URI,并且可以存储标题(如果可用)。

其他组件集合或集合阅读器实现可能会做类似的事情。

披露:我正在开发DKPro Core和Apache UIMA