我正在尝试将五个左右的表从MS SQL Server 2005导入到Ubuntu上的Solr 4.3.0。最后我想导入每个表中的所有行,但是现在我使用“top(10000)”来限制我的导入时间,直到我可以调试我的配置和查询。
它现在大部分都在工作,但我遇到的问题是当我用以下方式检查状态时:
http://192.168.1.3:8983/solr/dataimport
它告诉我它已经运行了48分钟,并获得了超过80万行。显然我的配置有问题,但我没有线索。
<str name="status">busy</str>
<str name="importResponse">A command is still running...</str>
<lst name="statusMessages">
<str name="Time Elapsed">0:48:35.0</str>
<str name="Total Requests made to DataSource">821</str>
<str name="Total Rows Fetched">8165164</str>
<str name="Total Documents Processed">0</str>
<str name="Total Documents Skipped">0</str>
<str name="Full Dump Started">2013-05-21 18:14:15</str>
</lst>
我的查询看起来像:
select top (10000) foo, bar from [DBName].dbo.TableName
可能我的问题是我使用嵌套实体而不是非嵌套实体。我在研究如何配置data-config.xml时看到过这两个例子,我不清楚它们之间的区别。
此:
<entity>
</entity>
<entity>
</entity>
或者这个:
<entity>
<entity>
</entity>
</entity>
我正在使用TemplateTransformer将我的表中的主键附加到一个名为id的uniqueKey中:
<field column="id" template="${GetAds.ADS_WPID},${Foo.MI_WPID},${Bar.MERCHANTID},${Baz.R4SE_WPID},${Boo.CR_WPID}" />
我已经在Solr上殴打了两个多星期,所以我的新老板对我不耐烦了。我很亲密,我可以品尝它,但不知道如何从这里开始。
感谢你给我的任何建议。