对不起所有的设置。这是一个配置单元数据类型和注释问题。
我在HDFS中有一个文件,它结合了4组表数据。提前打破数据不是我的首选。前4行指定列标题:
* 1 col1,col2,col3 * 2可乐,colb,colc,冷,col5e 等....
数据行以标题位置1的匹配数字开头。
1个数据,数据,数据, 2数据,数据,数据,数据,数据, 等...
基本配置单元表只是原始文件的col0 - col60。我已经尝试创建一个CTAS表来保存所有“1”列,一个用于“2”列,我可以在其中指定数据类型和注释。由于列名不同,我不能在基表上给出列名,也不能用基于列的元数据对它们进行评论。
这个DDL不起作用,但举一个我希望做的例子。有什么想法吗?
CREATE TABLE foo (
col1 as meaningful_name string comment 'meaningful comment')
as
SELECT col1
FROM base_hive table
WHERE col1 = 1;
CREATE TABLE foo
as
SELECT col1 string comment 'meaningful comment'
FROM base_hive table
WHERE col1 = 1;
感谢TD
答案 0 :(得分:1)
我不太了解你在这里想要达到的目标,但是看看你的DDL,我可以看到一些错误。对于正确的CREATE TABLE AS SELECT
实现,pl使用以下DDL:
CREATE TABLE foo (
col1 STRING COMMENT 'meaningful comment')
AS
SELECT col1 AS meaningful_name
FROM base_hive table
WHERE col1 = 1;