镶嵌文件生成与蜂巢

时间:2017-05-09 00:18:24

标签: hive hortonworks-data-platform parquet ambari beeline

我试图用hive生成一些镶木地板文件,为了实现这个目的,我从一些.tbl文件加载了一个普通的hive表,通过hive中的这个命令:

创建表区域( R_REGIONKEY BIGINT, R_NAME STRING,  R_COMMENT STRING)

行格式删除     FIELDS终止于' |'     存储为文本文件     location' / tmp / tpch-generate';

在此之后我只执行这2行:

创建table parquet_reion LIKE region STORED AS PARQUET;

插入到parquet_region select * from region;

但是当我检查HDFS中生成的输出时,我找不到任何.parquet文件,我发现文件名称如0000_0到0000_21,它们的大小总和比原来的tbl文件大得多。

我在做什么错了?

1 个答案:

答案 0 :(得分:1)

插入语句不会创建带扩展名的文件,但这些是镶木地板文件。

您可以使用DESCRIBE FORMATTED <table>来显示表格信息。

hive> DESCRIBE FORMATTED <table_name>

附加说明:您还可以使用以下查询从源表创建新表:

CREATE TABLE new_test row STORED AS PARQUET AS select * from source_table

它将创建新表作为镶木地板格式并复制结构和数据。