是否可以在具有不同架构的镶木地板文件上创建外部配置单元表?

时间:2019-07-29 04:34:16

标签: hadoop hive parquet

我的镶木地板文件的结构如下:

+------+------------------+------------------+
| col1 |       col2       |        col3      |
+------+------------------+------------------+
|  v0  | { k1:v1, k2:v2 } | { k3:v3, k4:v4 } |
+------+------------------+------------------+

col2和col3是映射列。 我希望使用下面的架构创建一个配置单元表,如下所示:

+-------+-----+-----+-----+-----+
| col1  |  k1 |  k2 |  k3 |  k4 |
+-------+-----+-----+-----+-----+
|  v0   |  v1 |  v2 |  v3 |  v4 |
+-------+-----+-----+-----+-----+

是否可以创建上述映射?我熟悉在hbase表上创建外部表的类似过程。

1 个答案:

答案 0 :(得分:0)

您可以通过以下步骤进行操作:

1。创建一个临时表并按原样存储文件(具有映射列类型);

2。使用所需的最终结构创建第二个表;

3。从临时表插入第二个表。插入时,您需要使用一些功能,例如:修剪,分割等。可以使用this example