外部加入后Hive缺少字段

时间:2015-01-08 20:00:04

标签: hadoop hive

我试图将两张桌子连在一起:

Table1
id x2 x3
--------
12 22 12
13 18 33
...

Table2
id x4 x5 ...
12 33 54
15 91 22
...

问题是当我进行外连接时:

CREATE TABLE merged_users
  AS
    SELECT Table1.id, x2, x3, x4, x5 
    FROM Table1 LEFT OUTER JOIN Table2 ON Table1.id = Table2.id

我留下了一个缺少id列和其他一些列的表

SELECT * FROM merged_users

merged_users 
54 212 ... 
14 412 ...

id does not appear in this table even though I specified for it in the join

如果我选择它

SELECT id FROM merged_users LIMIT 5

它只返回5行空格。

这是一个奇怪的错误,我不确定它的来源。我的csv投入很奇怪吗?它们只是来自MySQL的直接csv转储。

我在EMR上运行Hive。

1 个答案:

答案 0 :(得分:0)

找到我的解决方案:

我没有解析我的sql转储中的新行,并且它导致了hive问题。谢谢你们!