Question

我有一个本地文件movies.dat，格式为movie_id：movie_title：genre。例如：
1：MOVIE1：喜剧
2：电影2：剧情
3：MOVIE3：恐怖
...
我使用以下命令创建外部表。

CREATE EXTERNAL TABLE movies(movie_id INT, movie_title String, genre String)
ROW FORMAT
DELIMITED FIELDS TERMINATED BY '\:' -- need backslash!!
LOCATION '/exc103320/movies_copy'; -- name of the directory to copy the original file

然后，我通过

将数据加载到表中

LOAD DATA LOCAL INPATH 'movies.dat' OVERWRITE INTO TABLE movies;

当我跑SELECT * FROM movies LIMIT 3;时我看到前3行当我运行SELECT movie_id FROM movies LIMIT 3;时，我收到以下错误

总工作量= 1
从1开始工作1 减少任务的数量设置为0，因为没有减少操作员
开始工作= job_1420729875693_6595，跟踪网址= http://cshadoop1.utdallas.edu:8088/proxy/application_1420729875693_6595/
杀死命令= /usr/local/hadoop-2.4.1/bin/hadoop job -kill job_1420729875693_6595
Stage-1的Hadoop作业信息：映射器数量：0;减速机数量：0 2015-03-29 17：14：5420第1阶段地图= 0％，减少= 0％结束工作= job_1420729875693_6595有错误在作业期间出错，获取调试信息...... 工作追踪网址：http://cshadoop1.utdallas.edu:8088/cluster/app/application_1420729875693_6595
FAILED：执行错误，从org.apache.hadoop.hive.ql.exec.mr.MapRedTask返回代码2 MapReduce工作推出：
作业0：HDFS读取：0 HDFS写入：0失败
总MapReduce CPU使用时间：0毫秒

知道为什么会这样吗？

Answer 1

我相信你不需要＆＃34; ROW FORMAT中的反弹被终止的领域＆＃34;言。

尝试这样的DDL语句，看看它是否有效。

创建EXTERNAL TABLE电影（movie_id INT，movie_title String，genre String）行格式被终止的领域＆＃39;：＆＃39; LOCATION＆＃39; / exc103320 / movies_copy＆＃39;;

错误，从org.apache.hadoop.hive.ql.exec.mr.MapRedTask返回代码2

1 个答案: