我使用tika-parsers作为Web应用程序的一部分
<groupId>org.apache.tika</groupId>
<artifactId>tika-parsers</artifactId>
<version>1.11</version>
并且在wildyfly(8.2.1和10.0.0.RC4)上部署它时遇到了问题。 通过添加包含:
的jboss-all.xml,这是resolved<jboss xmlns="urn:jboss:1.0">
<weld xmlns="urn:jboss:weld:1.0" require-bean-descriptor="true"/>
</jboss>
但现在 tika会返回空字符串,例如 pdf或ms office文件。我假设它正在回落到EmptyParser。文本文件似乎有效。
这是我的简单测试代码,在作为junit测试运行时可以正常工作。
AutoDetectParser parser = new AutoDetectParser();
BodyContentHandler handler = new BodyContentHandler(9000000);
Metadata metadata = new Metadata();
parser.parse(entry.getValue(), handler, metadata);
String s = handler.toString();