Question

CREATE EXTERNAL TABLE old_events
(day STRING, foo STRING, count STRING, internal_id STRING)
PARTITIONED BY (ds string)
ROW FORMAT DELIMITED
FIELDS TERMINATED BY '\t'
LOCATION '${INPUT}';

CREATE EXTERNAL TABLE events
(internal_id, foo STRING, count STRING)
PARTITIONED BY (ds string)
ROW FORMAT DELIMITED
FIELDS TERMINATED BY '\t'
LOCATION '${OUTPUT}';

INSERT OVERWRITE TABLE events
SELECT e2.internal_id, e2.foo, count(e1.foo)
FROM old_events e2
LEFT OUTER JOIN old_events e1
ON e1.foo = e2.foo
WHERE e1.event = 'event1'
AND e2.event = 'event2'
AND ds = date_sub('${DAY}',1)
GROUP BY e2.internal_id, e2.foo;

失败：语义分析出错：在多个表/子查询中找到列ds

我在添加获取当前日期的ds变量时收到此错误。我如何用上面的脚本实现日期分区。

Answer 1

您需要在ds子句中为WHERE添加别名。例如，ds = date_sub('${DAY}',1)到e2.ds = date_sub('${DAY}',1)。

为了澄清你的问题，这里有一个较小的例子，显示了相同的行为

CREATE EXTERNAL TABLE example
(a INT, b INT)
LOCATION '${OUTPUT}';

SELECT *
FROM example e1
JOIN example e2
  ON e1.a = e2.a
WHERE b = 5;

这会产生同样的错误：

FAILED: SemanticException Column b Found in more than One Tables/Subqueries

问题是，b列example列为e1和e2。您和我可能知道，如果您在列example上加入a，那么e1.b与e2.b相同，因此它不需要别名，但Hive不会知道这一点，所以你需要选择一个来消除任何歧义。这里b是否是分区列并不重要。

FAILED：语义分析出错：在多个表/子查询中找到列

1 个答案: