在遥远的玻璃鱼上解析(使用Tika)

时间:2012-02-23 07:29:12

标签: solr glassfish apache-tika

我正在使用Tika解析器将我的文件索引到Solr中。我创建了自己的解析器(扩展了XMLParser)。它使用我自己的mimetype。 我创建了一个jar文件,里面看起来像这样:

src
|-main
    |-some_packages
        |-MyParser.java
    |resources
        |-META-INF
            |-services
                |-org.apache.tika.parser.Parser (which contains a line:some_packages.MyParser.java)
        |_org
            |-apache
                |-tika
                    |-mime
                        |-custom-mimetypes.xml 

在custom-mimetypes中我把新的mimetype定义为因为我的xml文件有一些特殊的标签。

现在问题出在哪里:我一直在使用安装在本地计算机上的glassfish上的Solr进行解析和索引编制。它运作得很好。然后我想在一些远程服务器上安装它。安装了相同版本的glassfish(3.1.1)。我复制粘贴了Solr应用程序,它是所有库的主目录(包括tika jar和我的自定义解析器的jar)。不幸的是它不起作用。将文件发布到Solr后,我可以在内容类型字段中看到它检测到我的自定义mime类型。但是,如果MyParser类从未运行过,那么就没有任何字段可以存在。我得到的唯一领域是来自都柏林核心的领域。我检查(通过简单地添加一些打印线)Tika只使用XMLParser。 有没有人有类似的问题?如何处理?

1 个答案:

答案 0 :(得分:0)

问题是我使用Java 7编译我的解析器,但Apache Tika是用Java 5编译的......