我试图将两张桌子连在一起:
Table1
id x2 x3
--------
12 22 12
13 18 33
...
Table2
id x4 x5 ...
12 33 54
15 91 22
...
问题是当我进行外连接时:
CREATE TABLE merged_users
AS
SELECT Table1.id, x2, x3, x4, x5
FROM Table1 LEFT OUTER JOIN Table2 ON Table1.id = Table2.id
我留下了一个缺少id列和其他一些列的表
SELECT * FROM merged_users
merged_users
54 212 ...
14 412 ...
id does not appear in this table even though I specified for it in the join
如果我选择它
SELECT id FROM merged_users LIMIT 5
它只返回5行空格。
这是一个奇怪的错误,我不确定它的来源。我的csv投入很奇怪吗?它们只是来自MySQL的直接csv转储。
我在EMR上运行Hive。
答案 0 :(得分:0)
找到我的解决方案:
我没有解析我的sql转储中的新行,并且它导致了hive问题。谢谢你们!