在Solr中索引我自己的数据

时间:2012-06-13 01:03:40

标签: solr indexing

我是Solr的新手,有几个问题可以向更有经验的人寻求帮助:

  1. 我能够运行示例,但是什么才是start.jar?

  2. 我知道通过运行“java -jar start.jar”,我可以启动solr。但是,在我索引自己的数据后,我是否运行此命令,而不是给定的样本数据?如果没有,我该怎么做用我自己的索引数据运行我自己的solr实例?

  3. 我确实需要索引自己的示例数据,与根据给定的示例solr事物无关。我该怎么办呢?我应该复制示例目录然后修改sechema.xml中的字段吗?我应该运行post.sh相应地索引数据,就像我设置示例solr所做的那样?

  4. 非常感谢你的帮助!

3 个答案:

答案 0 :(得分:0)

步骤:

  1. 确定您在SOLR中存储的文档结构。 (有点像为一个表创建关系数据库的模式)。
  2. 删除示例核心并使用该架构创建自己的核心
  3. 一旦架构正常运行且没有错误(您检查托管SOLR应用程序的服务器日志)您可以开始将您拥有的数据提供给SOLR。您可以通过HTTP以SOLR Wiki中记录的特定结构进行POST。各种框架都有一些类来处理它。
  4. 标记为Wiki,因为对于那些不打扰RTFM的人来说,这个答案太宽泛了......

答案 1 :(得分:0)

亲爱的自定义索引并不是一项艰巨的任务,因为我几天前就开始研究它了。首先,您需要根据schema.xml编写包含字段的xml,csv或json(solr支持的格式),然后在example / exampledocs中运行以下命令

对于文档mydoc.xml

./ post.sh mydoc.xml

如果在输出中,状态值为0,则索引成功,您可以在solr中搜索文档

参考:http://www.solrtutorial.com/solr-in-5-minutes.html

答案 2 :(得分:0)

虽然这个问题很老,但我正在为同样问题的新访问者写信。用几句话就无法回答这个问题。您必须了解Solr是什么,Solr Admin UI是什么,为什么我们需要Solr而不是关系数据库。然后,您可以了解如何导入示例数据。我最近发表了两篇文章,即Solr简介和导入样本数据,这些可能对您有所帮助。

http://www.devtrainings.com/2017/03/apache-solr-introduction-and-server.html

http://www.devtrainings.com/2017/03/apache-solr-index-data-and-run-search.html