我们每天都有报告发布到Solr,我们观察到的是一种奇怪的现象,即每次运行的文档数量增加之后,都会随机出现。 对于前。到昨天为止,集合的数量是500,今天我们推送了10个文档,所以数量应该是510,但我们认为是511或512。可能是什么原因?
我们正在通过Hive推送数据,并使用solr-hive-serde-3.0.0.jar创建Solr集合。在我们的表中有一个名为load_date的列,我们正在运行类似查询
插入abc_table中,从xyz表中选择*,其中load_date ='2019-02-27';
xyz表连接到Solr集合的地方。
CREATE EXTERNAL TABLE `xyz`(
)
ROW FORMAT SERDE
'com.lucidworks.hadoop.hive.LWSerDe'
STORED BY
'com.lucidworks.hadoop.hive.LWStorageHandler'
WITH SERDEPROPERTIES (
'field.delim'=',',
'serialization.format'=',')
LOCATION
'hdfs://hdfs path'
TBLPROPERTIES (
'last_modified_by'='a',
'last_modified_time'='1111',
'numFiles'='0',
'numRows'='0',
'rawDataSize'='0',
'solr.collection'='xyz',
'solr.query'='*:*',
'solr.server.url'='http://10.10.10.10:8886/solr',
'totalSize'='0',
'transient_lastDdlTime'='1551191527')