HIVE表格式如何查找给定的数据输入?

时间:2014-01-21 14:58:14

标签: sql hadoop hive

我的数据格式如下

6856437950      11/16/2008 22:36:38 8204208990      1001004006044273
6715281120      11/16/2008 15:29:42 8132862237      1001004005059895

我创建的Hive表是以下

CREATE TABLE t2 (session_id STRING, date_time STRING, customer_id STRING)
ROW FORMAT DELIMITED
FIELDS TERMINATED BY '\t'
STORED AS TEXTFILE;

当我将数据加载到表格中并以下列格式显示内容时显示:

6856437950      11/16/2008 22:36:38 8204208990      1001004006044273            NULL    NULL
6715281120      11/16/2008 15:29:42 8132862237      1001004005059895            NULL    NULL

它显示行中的所有元素都分配给变量session_id,其余的date_time和customer_id为NULL。

我相信我在FIELD TERMINATED子句中犯了一个错误,但我不确定分配它的值是什么。

1 个答案:

答案 0 :(得分:0)

hive(默认)> CREATE TABLE t2(session_id STRING,date_time STRING,customer_id STRING)

  

行格式删除   字段由'\ t'终止   存储为文本文件;   好   所用时间:9.343秒

hive(默认)> desc t2; 好 col_name data_type comment session_id字符串
date_time字符串
customer_id string
所用时间:0.319秒

hive(默认)> LOAD DATA LOCAL INPATH'/ tmp / input.txt'INTO表t2; 从文件复制数据:/tmp/input.txt 复制文件:file:/tmp/input.txt 将数据加载到表default.t2 好 所用时间:0.766秒 hive(默认)> select * from t2; 行

session_id  date_time   customer_id
6856437950  11/16/2008 22:36:38 8204208990  1001004006044273
6715281120  11/16/2008 15:29:42 8132862237  1001004005059895

所需时间:0.494秒 配置单元(默认)