Hive表没有与HDFS相同的数据

时间:2017-01-09 20:47:56

标签: hadoop hive hdfs

HDFS中的数据与hive表中的数据不匹配。我有下表:

CREATE TABLE `tbl` (
  `user_id` bigint,
  `type` int
)ROW FORMAT DELIMITED
FIELDS TERMINATED BY '\t'
COLLECTION ITEMS TERMINATED BY '\n'

我正在执行两个插入:

val table = "tbl"
firstData.insertInto(table, false)
secondData.insertInto(table, false)

在HDFS中创建了两个文件 - 000000_0000001_0 - 一个包含第一组数据,另一个包含第二组数据。这是正确的,但是当我这样做时:

hive -e 'SELECT * FROM tbl' > '/tmp/output_tbl.csv'

我只获得了第一个数据集。怎么了?这是预期的行为吗?

0 个答案:

没有答案