我想要做的是索引Solr中的一些文档并知道它是如何工作的。我已经安装了Solr和Tomcat,可以在localhost上看到Solr Admin UI:8080 / solr / admin / 现在,我想在索引中添加一些文档,我可以知道如何继续进行吗?我在互联网上找到的关于此的文档非常少。 在教程http://lucene.apache.org/solr/tutorial.html#Indexing+Data中,他们要求运行java -jar post.jar solr.xml monitor.xml命令,但在运行之后我得到连接拒绝错误,因为它是jetty。 安装jetty后我尝试了telnet:我收到“Connection refused”错误
我无法理解问题所在。
答案 0 :(得分:2)
正如手册所述,有几种方法可以将数据索引到Solr中:
- 使用Data Import Handler (DIH)从数据库导入记录。
- Load a CSV file(逗号分隔值),包括由Excel或MySQL导出的值。
- 使用Solr Cell索引二进制文档,例如Word和PDF (ExtractingRequestHandler)。
- 使用SolrJ for Java或其他Solr clients以编程方式创建 要发送给Solr的文件。
post.jar 脚本似乎不是用于测试以外的用途。它只是Solr客户端的简化实现(仅处理XML导入)。
为此,我成功地使用了DIH和(PHP)Solr客户端。前者是Solr的扩展,它允许您将数据源(在我的案例中为MySQL)映射到Solr索引。在基本形式中进行设置并不困难,并且在DataImportHandler section of the Solr Wiki中进行了很好的解释。如果您希望在软件级别控制索引过程(或部分索引过程),则可以使用自定义应用程序来使用existing clients之一。
我建议你试试其中一个选项。