我试图用hive生成一些镶木地板文件,为了实现这个目的,我从一些.tbl文件加载了一个普通的hive表,通过hive中的这个命令:
创建表区域( R_REGIONKEY BIGINT, R_NAME STRING, R_COMMENT STRING)
行格式删除 FIELDS终止于' |' 存储为文本文件 location' / tmp / tpch-generate';
在此之后我只执行这2行:
创建table parquet_reion LIKE region STORED AS PARQUET;
插入到parquet_region select * from region;
但是当我检查HDFS中生成的输出时,我找不到任何.parquet文件,我发现文件名称如0000_0到0000_21,它们的大小总和比原来的tbl文件大得多。
我在做什么错了?
答案 0 :(得分:1)
插入语句不会创建带扩展名的文件,但这些是镶木地板文件。
您可以使用DESCRIBE FORMATTED <table>
来显示表格信息。
hive> DESCRIBE FORMATTED <table_name>
附加说明:您还可以使用以下查询从源表创建新表:
CREATE TABLE new_test row STORED AS PARQUET AS select * from source_table
它将创建新表作为镶木地板格式并复制结构和数据。