在我的Cassandra数据库中,我有一个名为Person的表,大约有10,00,000行。我已经整合了Solr和Cassandra。
当我尝试使用最小行数(大约100)索引数据时,所有行都被编入索引。但是,如上所述,如果有大量行,我只能索引10,000行。
solr对索引数据有任何限制吗?我试图将其谷歌,但无法找到任何快速答案。或者它是否使用唯一值进行索引,因为我还有许多重复值?或者是否像早期的记录被删除并使用最新的索引更新?
答案 0 :(得分:1)
文档是Solr中的信息单元,每个文档必须具有唯一键。 这必须是一个字段,并且不允许Solr实例中的任何重复。 这意味着使用重复键索引的任何文档都将覆盖过去的文档。 因此旧文档将被删除并插入新文档。
唯一键在schema.xml中定义,默认为“id”。