索引Solr文档时查询mysql数据库

时间:2011-09-01 14:46:59

标签: mysql indexing solr

我需要使用我可以从mysql数据库中获取的详细信息来更新我的solr文档。

示例:

  • solr field“city” - > “伦敦”(使用post.jar工具从xml源读取)
  • 关于更新时间(requestHandler / update已配置自定义插件以执行其他操作)solr应查询mysql以获取有关“伦敦”(或任何刚读过的)的更多信息
  • solr使用查询结果
  • 更新该文档的字段

我一直在尝试使用JDBC插件和DIH处理程序(我只能使用调用/ dataimport / full-import ...而且我不能在我的具体情况下)并且到目前为止没有成功:(

你们中有人有同样的问题吗?你是怎么解决的?谢谢!

编辑:我忘了,对于dih配置,我尝试按照本指南http://www.cabotsolutions.com/2009/05/using-solr-lucene-for-full-text-search-with-mysql-db/

1 个答案:

答案 0 :(得分:0)

在浏览器中访问时,请包括/ dataimport / full-import的完整输出。 Solr错误消息可能会变得神秘。

您是否考虑过按XML上传文档http://wiki.apache.org/solr/UpdateXmlMessages。它功能更强大,允许您在上传文档时使用自己的逻辑。

  1. 从SQL中读取每一行,并在标签下为每个文档撰写XML文档(字符串)。

  2. 将整个XML字符串发布到/ update。别忘了将MIMEtype标头设置为 text / xml 。并确保在POST上设置您的Servler容器(Tomcat,Jetty)上传限制(Tomcat有2mb限制,如果我没记错的话)

  3. 不要忘记提交和优化命令