HDFS中的数据与hive表中的数据不匹配。我有下表:
CREATE TABLE `tbl` (
`user_id` bigint,
`type` int
)ROW FORMAT DELIMITED
FIELDS TERMINATED BY '\t'
COLLECTION ITEMS TERMINATED BY '\n'
我正在执行两个插入:
val table = "tbl"
firstData.insertInto(table, false)
secondData.insertInto(table, false)
在HDFS中创建了两个文件 - 000000_0
和000001_0
- 一个包含第一组数据,另一个包含第二组数据。这是正确的,但是当我这样做时:
hive -e 'SELECT * FROM tbl' > '/tmp/output_tbl.csv'
我只获得了第一个数据集。怎么了?这是预期的行为吗?