我们一直在用Apache UIMA做一些测试。结果太棒了!
我们理想的设置将是UIMA与SOLR的紧密集成。理想情况下,我们希望传递我们通过UIMA索引的所有内容,以获取更多元数据。
有一些示例和文档可用于如何与SOLR Update处理程序进行UIMA集成,但理想情况下我们希望使用现有的DataImportHandler(DIH)。我们所有的数据都是通过JDBC连接导入的,应该在索引之前传递给UIMA。
有人能说明如何实现这个目标吗?
谢谢,
勒
答案 0 :(得分:1)
数据导入处理程序确实支持update.processor 因此,您可以将dataimport处理程序与uima更新处理器绑定 -
<requestHandler name="/dataimport" class="org.apache.solr.handler.dataimport.DataImportHandler">
<lst name="defaults">
<str name="config">data-config.xml</str>
<str name="update.processor">uima</str>
</lst>
</requestHandler>
只是一个选项,我自己没试过。