我有一个带有ORC的表(事务为true,zlib压缩)
由名为pdate
的列进行分区。
我正在尝试将此表与另一个表合并。
merge into source_t using target_t
on source_t.id=target_t.id WHEN MATCHED THEN UPDATE SET
col=col1,
col2=col2
WHEN NOT MATCHED THEN
INSERT VALUES
( target_t.id,
target_t.name,
'20190715');
20190715 -它是我的分区,我手动给出了。在第一次合并没有问题。但是第二次运行合并后,我无法查询该表中的数据。
hive> select * from source_t limit 1;
OK
Failed with exception java.io.IOException:org.apache.orc.FileFormatException: Not a valid ORC file
Time taken: 0.093 seconds
hive>