我是solr的新手,我对delta-imports有一个非常基本的问题。我的mySQL数据库中有几个新记录。因此,当我在第二个x开始导入时,很有可能,我会在开始导入后的同一秒内在数据库中获得一些新记录,但下次当我启动delta-import时,它将检查“ data_mport.properties中的last_index_time“并将导入在此第二个x之后更改的所有记录。因此,我将丢失在开始上次导入后在第二个x中更改的所有记录。 如果我是对的,即使可以将时间戳从几秒钟改为例如,也是同样的问题。毫秒。时间窗口会更小,丢失的记录数量会更少,但问题本身仍然存在。
我没有在教程或其他任何地方找到任何关于此问题的提及。我是第一个每秒处理几个记录的人,还是我想念别的东西?
非常感谢提前!
答案 0 :(得分:0)
如果要处理确切的秒数,您只需检查等于或大于上次修改时间的记录 无论如何,如果记录已经存在(由唯一键标识),它将被覆盖。 Solr将默认更新记录,因此不会创建重复项。