如何使用文件中提到的列名将文件加载到HIVE?

时间:2018-09-27 14:56:43

标签: hive

我有一个已加载到新创建的配置单元表中的文本文件。当我得到文件时,它也具有列名。因此,我从文件中删除了列名,仅加载了数据。但是,我在前两行中获取“ null”,然后开始数据。该表有39列。我非常确定null值是用于列名的。

下面是选择查询的输出

NULL    NULL    NULL    NULL    NULL    NULL    NULL    NULL    NULL    NULL    NULL    NULL    NULL    NULL    NULL    NULL    NULL    NULL    NULLNULL     NULL    NULL    NULL    NULL    NULL    NULL    NULL    NULL    NULL    NULL    NULL    NULL    NULL    NULL    NULL    NULL    NULL    NULL
600002158100    2000-02-15      2018-09-24 07:06:26     63      1       0       0       0       0       0       1       0       0       0       0       0   00       0       0       0       0               "S"     0       NULL    "Y"     "N"     "N"     0       7       "xyz"  "MEDIUM"        "abc" "pqr"  "Sam"   1       "chris"        1999-07-31

1)So, do I had to load the files including the column names with it? 
2) I still believe that the file that needs to be loaded need not have column names in it, just the data. please correct me if I am wrong.

请让我知道我的错误。

使用tblproperties后的新输出

abc      xyz        NULL    NULL    NULL    NULL    NULL    NULL    NULL    NULL    NULL    NULL    pqr       name  NULL     NULL    age    NULL    NULL    city    country       date     year     month

即当我触发“ select * from tbl limi4”时,我得到标题名称,然后得到数据。请指教

1 个答案:

答案 0 :(得分:0)

您可以在创建有能力(或稍后更改)以跳过标题的同时设置tablproperties。

tblproperties ("skip.header.line.count"="1")

此处 count 显示了表示标题的前几行。