集成MONGODB和SOLR

时间:2013-06-19 11:03:37

标签: mongodb solr

我尝试使用mongodb提供的MONGO CONNECTOR集成MONGODB和SOLR,mongodb以副本集配置运行。

**python2.7 mongo_connector.py -m localhost:27017 -t http://localhost:8983/solr -u_id -d ./doc_managers/solr_doc_manager.py**

我的输出是

2013-06-19 16:19:10,943 - INFO - Finished 'http://localhost:8983/solr/update/?commit=true' (post) with body 'u'<commit ' in 0.012 seconds.

但我无法配置SOLR从MONGODB获取文件。请帮我如何配置SOLR从MONGODB获取文件。我应该使用SolrMongoImporter吗?

2 个答案:

答案 0 :(得分:0)

我遇到了同样的问题。我无法解决所以我发现了一个有趣的链接: http://derickrethans.nl/mongodb-and-solr.html 它通过php脚本连接mongo和solr。甲

答案 1 :(得分:0)

第1步:安装Mongo Connector

安装mongo连接器

 Pip install mongo-connector

第2步:创建Solr Core

 ./bin/solr create -c <corename>-p 8983 -s 3 -rf 3

第3步:配置为Solr

要编制索引的mongodb文档中的字段在schema.xml配置文件中指定。在vi编辑器中打开schema.xml。如

vi/solr/solr-6.6.2/server/solr/configsets/data_driven_schema_configs/ 
conf/schema.xml

第4步:Mongo Connector还会在字段ns和_ts中存储与其索引的每个mongodb文档关联的元数据。还要将ns和_ts字段添加到schema.xml。

<schema>
<?xml version="1.0" encoding="UTF-8" ?>
<schema name="example" version="1.5">
<field name="time_stamp" type="string" indexed="true"  stored="true"  
multiValued="false" />
<field name="category" type="string" indexed="true"  stored="true"  
multiValued="false" />
<field name="type" type="string" indexed="true"  stored="true"  
multiValued="false" />
<field name="servername" type="string" indexed="true"  stored="true"  
multiValued="false" />
<field name="code" type="string" indexed="true"  stored="true"  
multiValued="false" />
<field name="msg" type="string" indexed="true"  stored="true"  
multiValued="false" />
<field name="_ts" type="long" indexed="true" stored="true" />
<field name="ns" type="string" indexed="true" stored="true"/>
 <field name="_version_" type="long" indexed="true" stored="true"/>

</schema>

第5步:我们还需要配置  solrconfig.xml中的org.apache.solr.handler.admin.LukeRequestHandler请求处理程序。

在vi编辑器中打开solrconfig.xml。

 vi ./solr-5.3.1/server/solr/configsets/basic_configs/conf/solrconfig.xml

指定Mongo Connector的请求处理程序。

*<requestHandler name="/admin/luke" 
class="org.apache.solr.handler.admin.LukeRequestHandler" />*

还将auto commit配置为true,以便Solr在配置的时间后自动提交MongoDB中的数据。

<autoCommit>
<maxTime>15000</maxTime>
<openSearcher>true</openSearcher>
</autoCommit>

第6步:需要重启Solr

Bin/solr restart -force

启动MongoDB服务器 Mongo Connector需要运行MongoDB副本集才能在Solr中索引MongoDB数据。副本集是MongoDB服务器的集群,它实现复制和自动故障转移。副本集可以只包含一个服务器,端口指定为27017,MongoDB的数据目录指定为/ data / db,副本集名称指定为rs0,带有-replSet选项。

Sudo mongod --port 27017 --dbpath /data/db --replSet rs0

第7步:启动MongoDB Shell 使用以下命令启动Mongodb shell

Mongo

MongoDB shell启动了。我们需要启动副本集。运行以下命令以启动副本集。

 rs.initiate()

第8步:使用Solr启动MongoDB连接器和索引MongoDB数据库 运行Mongo-connector命令,如下所示

mongo-connector --unique-key=id –n solr.wlslog -m localhost:27017 -t 
http://xx.xxx.xxx.xx:8983/solr/wlslog -d solr_doc_manager

在上述声明中 solr.wlslog - &GT; solr是一个数据库名称wlslog是一个集合名称 的solr / wlslog - &GT; wlslog是一个核心名称

对于将来的参考,请使用以下链接 https://www.toadworld.com/platforms/nosql/b/weblog/archive/2017/02/03/indexing-mongodb-data-in-apache-solr