Tika在野生动物群上部署时返回空字符串

时间:2015-12-23 09:15:05

标签: java-ee deployment apache-tika

我使用tika-parsers作为Web应用程序的一部分

<groupId>org.apache.tika</groupId>
<artifactId>tika-parsers</artifactId>
<version>1.11</version>

并且在wildyfly(8.2.1和10.0.0.RC4)上部署它时遇到了问题。 通过添加包含:

的jboss-all.xml,这是resolved
<jboss xmlns="urn:jboss:1.0">
    <weld xmlns="urn:jboss:weld:1.0" require-bean-descriptor="true"/>
</jboss>

但现在 tika会返回空字符串,例如 pdf或ms office文件。我假设它正在回落到EmptyParser。文本文件似乎有效。

这是我的简单测试代码,在作为junit测试运行时可以正常工作。

AutoDetectParser parser = new AutoDetectParser();
BodyContentHandler handler = new BodyContentHandler(9000000);
Metadata metadata = new Metadata();
parser.parse(entry.getValue(), handler, metadata);
String s = handler.toString();

0 个答案:

没有答案