我试图说服solr执行sqlite数据库的批量导入。 我遵循Solr-Wiki的所有指示。 我配置了DataImportHandler以通过jdbc成功打开该数据库,我可以开始导入http://localhost:8080/solr/dataimport?command=full-import 但无论我做什么,DIH都没有添加任何文档,即使它似乎索引数据库
结果
<str name="command">full-import</str>
<str name="Total Requests made to DataSource">1</str>
<str name="Total Rows Fetched">**14**</str>
<str name="Total Documents Skipped">0</str>
<str name="Full Dump Started">2012-04-06 01:14:30</str>
<str name="">**Indexing completed**. **Added/Updated: 0 documents**. Deleted 0 documents.</str>
<str name="Committed">2012-04-06 01:14:32</str>
<str name="Optimized">2012-04-06 01:14:32</str>
<str name="Total Documents Processed">0</str>
我在Oracle DB中使用emp表
数据-config.xml中
<dataConfig>
<dataSource name="jdbc" driver="oracle.jdbc.driver.OracleDriver" url="jdbc:oracle:thin:@//localhost:1521/ORCL" user="scott" password="tiger"/>
<document>
<entity name="emp" query="select EMPNO, ENAME from EMP">
<field column="EMPNO" name="empno" />
<field column="ENAME" name="ename" />
</entity>
</document>
</dataConfig>
schema.xml中
<field name="empno" type="int" indexed="true" stored="true"/>
<field name="ename" type="string" indexed="true" stored="true"/>
它似乎不是索引,而是存储索引数据
为什么会出现这个问题?
编辑1 记录显示警告消息,如..
WARNING: Error creating document : SolrInputDocument[{ename=ename(1.0)={SMITH}, empno=empno(1.0)={7369}}]
org.apache.solr.common.SolrException: [doc=null] missing required field: id
at org.apache.solr.update.DocumentBuilder.toDocument(DocumentBuilder.java:346)
at org.apache.solr.update.processor.RunUpdateProcessor.processAdd(RunUpdateProcessorFactory.java:60)
at org.apache.solr.update.processor.LogUpdateProcessor.processAdd(LogUpdateProcessorFactory.java:115)
at org.apache.solr.handler.dataimport.SolrWriter.upload(SolrWriter.java:73)
at org.apache.solr.handler.dataimport.DataImportHandler$1.upload(DataImportHandler.java:293)
at org.apache.solr.handler.dataimport.DocBuilder.buildDocument(DocBuilder.java:636)
at org.apache.solr.handler.dataimport.DocBuilder.doFullDump(DocBuilder.java:268)
at org.apache.solr.handler.dataimport.DocBuilder.execute(DocBuilder.java:187)
at org.apache.solr.handler.dataimport.DataImporter.doFullImport(DataImporter.java:359)
at org.apache.solr.handler.dataimport.DataImporter.runCmd(DataImporter.java:427)
at org.apache.solr.handler.dataimport.DataImporter$1.run(DataImporter.java:408)
遵循那种日志和
此警告消息显示日志结束
2012. 4. 6 오후 12:12:25 org.apache.solr.update.processor.LogUpdateProcessor finish
INFO: {deleteByQuery=*:*,add=[(null), (null), (null), (null), (null), (null), (null), (null), ... (14 adds)],optimize=} 0 0
我认为缺少必填字段:id 与配置中的某些关系 schema.xml
<uniqueKey>id</uniqueKey>
但删除后,我收到了此消息
HTTP状态500 - solr配置中的严重错误。检查日志文件以获取有关可能出错的更多详细信息。如果您希望solr在配置错误后继续,请在solr.xml中更改:false --------------------------------- ---------------------------- org.apache.solr.common.SolrException:QueryElevationComponent要求架构使用StrField实现uniqueKeyField Org.apache.solr.hand形式中的org.apache.solr.handler.component.QueryElevationComponent.inform(QueryElevationComponent.java:158)。/ orr.apache.solrResourceLoader.inform
有什么建议吗?
答案 0 :(得分:3)
尝试:
<entity name="emp" query="select EMPNO, ENAME from EMP">
<field column="EMPNO" name="id" />
<field column="ENAME" name="ename" />
在data-config.xml中并放回:
<uniqueKey>id</uniqueKey>
在schema.xml中并让字段为id。
或者你可以简单地替换:
<uniqueKey>id</uniqueKey>
使用:
<uniqueKey>epno</uniqueKey>
希望能奏效。
答案 1 :(得分:1)
您还可以使用
添加自动增量ID <dataConfig>
<script><![CDATA[
id = 1;
function GenerateId(row) {
row.put('id', (id ++).toFixed());
return row;
}
]]></script>
<dataSource name="jdbc" driver="oracle.jdbc.driver.OracleDriver" url="jdbc:oracle:thin:@//localhost:1521/ORCL" user="scott" password="tiger"/>
<document>
<entity name="emp" query="select EMPNO, ENAME from EMP" transformer="script:GenerateId">
<field column="EMPNO" name="empno" />
<field column="ENAME" name="ename" />
</entity>
</document>
</dataConfig>