我有50Gb分区的Hive表(存储为Parquet)。 设置如下:
SET hive.exec.rowoffset = true;
SELECT distinct ROW__OFFSET__INSIDE__BLOCK
FROM schema.table;
-----------------------------+--+
| row__offset__inside__block |
+-----------------------------+--+
| 0 |
+-----------------------------+--+
SELECT max( BLOCK__OFFSET__INSIDE__FILE)
FROM schema.table;
+------------+--+
| _c0 |
+------------+--+
| 174580208 |
+------------+--+
不知何故row__offset__inside__block为零。
知道为什么吗?