我正在使用Tika解析器将我的文件索引到Solr中。我创建了自己的解析器(扩展了XMLParser)。它使用我自己的mimetype。 我创建了一个jar文件,里面看起来像这样:
src
|-main
|-some_packages
|-MyParser.java
|resources
|-META-INF
|-services
|-org.apache.tika.parser.Parser (which contains a line:some_packages.MyParser.java)
|_org
|-apache
|-tika
|-mime
|-custom-mimetypes.xml
在custom-mimetypes中我把新的mimetype定义为因为我的xml文件有一些特殊的标签。
现在问题出在哪里:我一直在使用安装在本地计算机上的glassfish上的Solr进行解析和索引编制。它运作得很好。然后我想在一些远程服务器上安装它。安装了相同版本的glassfish(3.1.1)。我复制粘贴了Solr应用程序,它是所有库的主目录(包括tika jar和我的自定义解析器的jar)。不幸的是它不起作用。将文件发布到Solr后,我可以在内容类型字段中看到它检测到我的自定义mime类型。但是,如果MyParser类从未运行过,那么就没有任何字段可以存在。我得到的唯一领域是来自都柏林核心的领域。我检查(通过简单地添加一些打印线)Tika只使用XMLParser。 有没有人有类似的问题?如何处理?
答案 0 :(得分:0)
问题是我使用Java 7编译我的解析器,但Apache Tika是用Java 5编译的......