使用solr索引和搜索MySQL

时间:2010-08-03 20:35:21

标签: java mysql search lucene solr

(我已在下面的XML中添加'以显示它)

大家好我想用solr索引我的MySQL数据库表。我已经安装了必要的java组件/适配器等。我的数据库名为'test_db',其中的表名为'table_tb'。该表包含2列(字段)

-Field 1称为“ID”,是一个自动增量的主键整数 -Field 2被称为'COLA',是文本

该表有两行(记录)ID = 1和ID = 2,每个对应于第二列的文本。我已经设置了以下conf文件(它们位于正确的目录中):

数据-config.xml中

<dataConfig>
  <dataSource type="JdbcDataSource"
              driver="com.mysql.jdbc.Driver"
              url="jdbc:mysql://localhost/test_db"
              user="username"
              password="db_pwd"/>

<document name="doc">

<entity name="test_tb" query="select ID from test_tb">
        <field column="ID" name="ID" />
        <field column="COLA" name="COLA" />
</entity>

  </document>
</dataConfig>

solrconfig.xml中

<requestHandler name="/dataimport" class="org.apache.solr.handler.dataimport.DataImportHandler">
<lst name="defaults">
  <str name="config">data-config.xml</str>
</lst>
</requestHandler>

schema.xml中

 <fields>
        <field name="ID" type="int" indexed="true" stored="true" required="true"/>
        <field name="COLA" type="string" indexed="true" stored="true" required="true"/>
 </fields>

 <uniqueKey>ID</uniqueKey>
在我的浏览器中

"[URL]:8983/solr/dataimport?command=full-import"我得到以下输出:

(1)浏览器输出(xml)

<response>
−
<lst name="responseHeader">
<int name="status">0</int>
<int name="QTime">1</int>
</lst>
−
<lst name="initArgs">
−
<lst name="defaults">
<str name="config">data-config.xml</str>
</lst>
</lst>
<str name="command">full-import</str>
<str name="status">idle</str>
<str name="importResponse"/>
−
<lst name="statusMessages">
<str name="Total Requests made to DataSource">1</str>
<str name="Total Rows Fetched">2</str>
<str name="Total Documents Skipped">0</str>
<str name="Full Dump Started">2010-08-03 16:15:51</str>
−
<str name="">

Indexing completed. Added/Updated: 0 documents. Deleted 0 documents.
</str>
<str name="Committed">2010-08-03 16:15:51</str>
<str name="Optimized">2010-08-03 16:15:51</str>
<str name="Total Documents Processed">0</str>
<str name="Total Documents Failed">2</str>
<str name="Time taken ">0:0:0.32</str>
</lst>
−
<str name="WARNING">
This response format is experimental.  It is likely to change in the future.
</str>
</response>

建议读取2条记录但未编入索引

服务器端输出

WARNING: Error creating document : SolrInputDocument[{ID=ID(1.0)={1}}]
org.apache.solr.common.SolrException: Document [null] missing required field: id


WARNING: Error creating document : SolrInputDocument[{ID=ID(1.0)={2}}]
org.apache.solr.common.SolrException: Document [null] missing required field: id

有谁知道我做错了什么?

提前感谢您的帮助!!!

3 个答案:

答案 0 :(得分:3)

字段'id'出现在文档的其他位置。我对此进行了评论并且有效。

答案 1 :(得分:2)

您需要具有synchronized:scheme.xml以及data-config.xml中的内容(字段的定义必须相同)

答案 2 :(得分:0)

<entity name="test_tb" query="select ID from test_tb">
        <field column="ID" name="ID" />
        <field column="COLA" name="COLA" />
</entity>

它应该是query =“select * from test_tb”我认为。

如果您从test_tb执行查询选择ID,则只需要一列,而您需要两列。