将10000行导入Solr可获取数十万行

时间:2013-05-22 02:14:14

标签: sql-server tsql configuration solr

我正在尝试将五个左右的表从MS SQL Server 2005导入到Ubuntu上的Solr 4.3.0。最后我想导入每个表中的所有行,但是现在我使用“top(10000)”来限制我的导入时间,直到我可以调试我的配置和查询。

它现在大部分都在工作,但我遇到的问题是当我用以下方式检查状态时:

http://192.168.1.3:8983/solr/dataimport

它告诉我它已经运行了48分钟,并获得了超过80万行。显然我的配置有问题,但我没有线索。

<str name="status">busy</str>
<str name="importResponse">A command is still running...</str>
<lst name="statusMessages">
<str name="Time Elapsed">0:48:35.0</str>
<str name="Total Requests made to DataSource">821</str>
<str name="Total Rows Fetched">8165164</str>
<str name="Total Documents Processed">0</str>
<str name="Total Documents Skipped">0</str>
<str name="Full Dump Started">2013-05-21 18:14:15</str>
</lst>

我的查询看起来像:

select top (10000) foo, bar from [DBName].dbo.TableName

可能我的问题是我使用嵌套实体而不是非嵌套实体。我在研究如何配置data-config.xml时看到过这两个例子,我不清楚它们之间的区别。

此:

<entity>
</entity>
<entity>
</entity>

或者这个:

<entity>
<entity>
</entity>
</entity>

我正在使用TemplateTransformer将我的表中的主键附加到一个名为id的uniqueKey中:

<field column="id" template="${GetAds.ADS_WPID},${Foo.MI_WPID},${Bar.MERCHANTID},${Baz.R4SE_WPID},${Boo.CR_WPID}" />

我已经在Solr上殴打了两个多星期,所以我的新老板对我不耐烦了。我很亲密,我可以品尝它,但不知道如何从这里开始。

感谢你给我的任何建议。

0 个答案:

没有答案