避免从dataimport上的solr中删除文档

时间:2017-08-09 07:11:07

标签: solr dataimporthandler

我正在尝试在Solr中添加3亿条记录,但发生了错误的事情。

从文档中删除2亿个Solr Start。

当我从Oracle向Solr添加2亿条记录时,每件事情都有效。

在下面的图片中

max Doc = 215077886

Num Docs :200979747

已删除文档:14098139

为什么Solr删除14098139 我尝试了很多次但是同样的结果来了

所以我的问题是有一个避免删除的配置,我无法知道

此链接中的所有配置文件: Conf files

我的服务器Ram 32 G

高清:2 Tera

修改

我解决问题我发现重复的uniqueKeys

enter image description here

enter image description here

1 个答案:

答案 0 :(得分:1)

通常这些问题是由重复的uniqueKeys引起的,因为完整的导入过程本身并没有删除文档(您可以要求它清除索引,但这是一个显式请求,或者使用单独的删除查询以删除作为增量查询的一部分而被删除的条目。

确保实际使用的文档对于设置为uniqueKey列的列是唯一的。如果稍后导入的文档与先前文档具有相同的uniqueKey,则新文档将覆盖旧文档(即添加和删除),从而导致deleted列中的计数。