如何从Hive到Solr增量加载数据

时间:2019-01-04 10:06:41

标签: solr hive

我有一个Solr集合,每天存储销售记录。假设1月1日我卖出了100种产品,并且从蜂巢到solr加载数据。第二天我又卖出了100种产品,我希望将数据从101加载到200,但是我的配置单元包含200条记录,因此如果我输入数据,我将获得300条记录。第一天起100,第二天起200(100(第一天)+ 100(第二天))。

1 个答案:

答案 0 :(得分:0)

没有办法将数据从配置单元逐步加载到solr。 1.从solr中删除数据,然后再次插入完整数据。    对于小桌子来说效果很好,但是对于大桌子会花费很多时间

  1. 使用where子句从配置单元中插入数据,以确保没有重复的数据。