AWS Athena-GENERIC_INTERNAL_ERROR:分区值数量与过滤器数量不匹配

时间:2019-07-10 22:10:52

标签: presto amazon-athena aws-glue

我正在查询雅典娜中的一个错误表:GENERIC_INTERNAL_ERROR:分区值数量与过滤器数量不符

我能够更早地查询它,但是添加了另一个分区(AWS胶水作业)来尝试优化联接,我稍后将在查询中进行此操作。我确实重新运行了搜寻器以更新表以反映分区。

我想知道这个错误的实际含义。

我尝试重新收集数据,但是没有运气。接下来,我要清除底层的S3数据,并从头开始重新处理整个集合,然后重新进行爬网。

SELECT *
FROM mydb.mytable
LIMIT 10

我想了解错误的含义以及是否有解决方法,而不是重新处理整个原始数据集并重新进行检索。

1 个答案:

答案 0 :(得分:2)

我今天有同样的问题。就我而言,这是因为s3中的某些基础数据已被删除,因此Glue表中的分区数与s3中的文件数不匹配。

要解决此问题,我只是删除了Glue中的表,然后重新运行搜寻器。