Apache Solr使用XPathEntityProcessor通过http索引xml-File

时间:2017-07-31 13:37:30

标签: apache solr

我遇到了问题,没有找到任何解决方案。 我正在寻找索引大量Notes-DB的最佳方法。 一种方法是,在我使用浏览器向REST Web服务发送请求后,我的数据库会生成一个XML文件。

我下载了该文件,并通过更新请求和文件上传将其导入管理控制台。 有用。我的架构是管理的(我有太多的字段可以手动完成)。

但我不知道如何用XPathEntityProcessor处理这个问题。 我的解决方案data-config.xml应该如何?

非常感谢你的帮助。我几乎绝望了。

1 个答案:

答案 0 :(得分:0)

我找到了部分解决方案。当我有以前在托管模式中添加的字段时使用它(使用updateRequestHandler和托管模式不需要这样做)。用简单的xml-File测试。 `

<dataConfig>
         <dataSource type="URLDataSource" />
        <document> 
                  <entity name="xml"
                      processor="XPathEntityProcessor"
                      url="http://path/to/test.xml"                       
                      useSolrAddSchema="true"
                      stream="true"
                      connectionTimeout="120000"
                      readTimeout="300000">
                   </entity>
         </document>
    </dataConfig>`

现在,日志说我只有“connection”的问题。