我正在查询雅典娜中的一个错误表:GENERIC_INTERNAL_ERROR:分区值数量与过滤器数量不符
我能够更早地查询它,但是添加了另一个分区(AWS胶水作业)来尝试优化联接,我稍后将在查询中进行此操作。我确实重新运行了搜寻器以更新表以反映分区。
我想知道这个错误的实际含义。
我尝试重新收集数据,但是没有运气。接下来,我要清除底层的S3数据,并从头开始重新处理整个集合,然后重新进行爬网。
SELECT *
FROM mydb.mytable
LIMIT 10
我想了解错误的含义以及是否有解决方法,而不是重新处理整个原始数据集并重新进行检索。
答案 0 :(得分:2)
我今天有同样的问题。就我而言,这是因为s3中的某些基础数据已被删除,因此Glue表中的分区数与s3中的文件数不匹配。
要解决此问题,我只是删除了Glue中的表,然后重新运行搜寻器。