我的数据格式如下
6856437950 11/16/2008 22:36:38 8204208990 1001004006044273
6715281120 11/16/2008 15:29:42 8132862237 1001004005059895
我创建的Hive表是以下
CREATE TABLE t2 (session_id STRING, date_time STRING, customer_id STRING)
ROW FORMAT DELIMITED
FIELDS TERMINATED BY '\t'
STORED AS TEXTFILE;
当我将数据加载到表格中并以下列格式显示内容时显示:
6856437950 11/16/2008 22:36:38 8204208990 1001004006044273 NULL NULL
6715281120 11/16/2008 15:29:42 8132862237 1001004005059895 NULL NULL
它显示行中的所有元素都分配给变量session_id,其余的date_time和customer_id为NULL。
我相信我在FIELD TERMINATED子句中犯了一个错误,但我不确定分配它的值是什么。
答案 0 :(得分:0)
hive(默认)> CREATE TABLE t2(session_id STRING,date_time STRING,customer_id STRING)
行格式删除 字段由'\ t'终止 存储为文本文件; 好 所用时间:9.343秒
hive(默认)> desc t2;
好
col_name data_type comment
session_id字符串
date_time字符串
customer_id string
所用时间:0.319秒
hive(默认)> LOAD DATA LOCAL INPATH'/ tmp / input.txt'INTO表t2; 从文件复制数据:/tmp/input.txt 复制文件:file:/tmp/input.txt 将数据加载到表default.t2 好 所用时间:0.766秒 hive(默认)> select * from t2; 行
session_id date_time customer_id
6856437950 11/16/2008 22:36:38 8204208990 1001004006044273
6715281120 11/16/2008 15:29:42 8132862237 1001004005059895
所需时间:0.494秒 配置单元(默认)