无法从我的配置单元查询创建外部表输出

时间:2016-12-09 09:04:01

标签: amazon-web-services hive hiveql emr

我有一个.csv文件,其中包含有关费城犯罪事件的数据。 我在亚马逊EMR中使用hive脚本将此数据转换为HIVE表。

我使用以下配置单元脚本:

CREATE EXTERNAL TABLE IF NOT EXISTS Crime(
Dc_Dist INT, 
PSA INT,
Dispatch_Date_Time TIMESTAMP,
Dispatch_Date date,
Dispatch_Time STRING, 
Hour INT,
Dc_Key BIGINT,
Location_Block STRING,
UCR_General INT,
Text_General_Code STRING,
Police_Districts INT,
Month STRING,
Lon STRING,  
Lat STRING)

COMMENT 'Data about crime from a public database'
ROW FORMAT DELIMITED
FIELDS TERMINATED BY ','
STORED AS TEXTFILE
location 's3://dsabucket/crimeData/crime';

This image is a screenshot of the workflow I follow to run the hive script on the AWS EMR cluster]

我运行此脚本,但我的输出文件夹中没有文件或数据。我不确定表是否正确创建。据我所知,'STORED AS TEXTFILE'行应将此表存储为文本文件。

1 个答案:

答案 0 :(得分:0)

检查创建的表格或不使用DESCRIBE

即DESCRIBE tableNAMe;