我在AWS EMR上使用Apache Drill 1.8.0并加入两个配置单元表。以下是示例查询。这在Drill CLI中工作正常但在运行几分钟后给出以下错误。如果我尝试简单的选择查询(从hive.table t1中选择t1.col),它在Drill CLI和UI中都可以正常工作。只有连接查询有问题。
如果我从后台取消加入查询,则会在UI中显示结果。这是非常奇怪的情况。
加入查询:
select t1.col FROM hive.table1 as t1 join hive.table2 as t2 on t1.col = t2.col limit 1000;
错误:
查询失败:发生错误
org.apache.drill.common.exceptions.UserRemoteException:SYSTEM ERROR:RpcException:下游不接受数据。片段1:4 [错误ID:0b5ed2db-3653-4e3a-9c92-d0a6cd69b66e在ip-172-31-16-222.us-west-2.compute.internal:31010]