如何使用UIMA和JCas访问文档元数据,如创建和修改日期或标题等?
答案 0 :(得分:3)
默认情况下,此类信息在UIMA中不可用。
某些集合阅读器实现可能会将此类信息存储在DocumentAnnotation或其他专用注释的子类型中。例如。 DKPro Core定义了DocumentMetaData类型,该类型派生自DocumentAnnotation,DKPro Core读取器组件存储文档的原始路径/ URI,并且可以存储标题(如果可用)。
其他组件集合或集合阅读器实现可能会做类似的事情。
披露:我正在开发DKPro Core和Apache UIMA