Solr重复数据删除使用overWriteDupes标志

时间:2014-02-04 11:33:48

标签: solr

我有一个配置,其中我有“overwriteDupes”= false。我添加了一些重复文件。结果:我在索引中得到了重复的文档。

当我更改为“overwriteDupes”= true时,重复的文档开始覆盖旧文档。

问题1:我如何实现,[如果不存在则添加,如果发现重复则失败],即模仿在尝试插入违反某些唯一约束的记录时失败的DB的行为。我认为“overwriteDupes”= false会这样做,但显然不是。

问题2:是否有一些围绕overwriteDupes的文档?我检查了现有的Wiki;那里的旗帜很少有解释。

谢谢,

-Amit

1 个答案:

答案 0 :(得分:2)

显然“overwriteDupes”= false确实允许重复文件。这种设置的实用程序是允许重复记录,但稍后可以根据签名字段查询它们,并做任何想要对它们做的事情。

Solr wiki文档中没有详细记录该行为。

如果在Solr中以直接的方式无法实现[如果不存在则添加,如果发现重复则失败]。