错误,从org.apache.hadoop.hive.ql.exec.mr.MapRedTask返回代码2

时间:2015-03-29 22:42:33

标签: select hive

我有一个本地文件movies.dat,格式为movie_id:movie_title:genre。例如:
1:MOVIE1:喜剧
2:电影2:剧情
3:MOVIE3:恐怖
...
我使用以下命令创建外部表。

CREATE EXTERNAL TABLE movies(movie_id INT, movie_title String, genre String)
ROW FORMAT
DELIMITED FIELDS TERMINATED BY '\:' -- need backslash!!
LOCATION '/exc103320/movies_copy'; -- name of the directory to copy the original file

然后,我通过

将数据加载到表中
LOAD DATA LOCAL INPATH 'movies.dat' OVERWRITE INTO TABLE movies;

当我跑SELECT * FROM movies LIMIT 3;时 我看到前3行 当我运行SELECT movie_id FROM movies LIMIT 3;时,我收到以下错误

总工作量= 1
从1开始工作1 减少任务的数量设置为0,因为没有减少操作员
开始工作= job_1420729875693_6595,跟踪网址= http://cshadoop1.utdallas.edu:8088/proxy/application_1420729875693_6595/
杀死命令= /usr/local/hadoop-2.4.1/bin/hadoop job -kill job_1420729875693_6595
Stage-1的Hadoop作业信息:映射器数量:0;减速机数量:0 2015-03-29 17:14:5420第1阶段地图= 0%,减少= 0% 结束工作= job_1420729875693_6595有错误 在作业期间出错,获取调试信息...... 工作追踪网址:http://cshadoop1.utdallas.edu:8088/cluster/app/application_1420729875693_6595
FAILED:执行错误,从org.apache.hadoop.hive.ql.exec.mr.MapRedTask返回代码2 MapReduce工作推出:
作业0:HDFS读取:0 HDFS写入:0失败
总MapReduce CPU使用时间:0毫秒

知道为什么会这样吗?

1 个答案:

答案 0 :(得分:0)

我相信你不需要" ROW FORMAT中的反弹 被终止的领域"言。

尝试这样的DDL语句,看看它是否有效。

创建EXTERNAL TABLE电影(movie_id INT,movie_title String,genre String) 行格式 被终止的领域':' LOCATION' / exc103320 / movies_copy';