我正在使用AWS Glue并使用爬虫来反映我的Redshift群集中特定架构的表格,以使我的Glue Jobs可以访问这些数据。这个爬虫已经工作了一个月或更长时间,但现在突然间我得到以下错误:
Error crawling database reporting: SQLException: SQLState: 42P01 Error Code: 500310 Message: [Amazon](500310) Invalid operation: relation "{table_name}" does not exist
但是,我可以查询相关的架构&表格与Glue正在使用的连接使用完全相同的凭据。我可以将子集分配给模式中的特定表,并让Glue反映这些表,但不是完整的模式或它遇到的有问题的表。
关于Glue如何反映Redshift中的表以及可能会发生什么的任何想法?爬虫都是漂亮的黑盒子,所以我很快就会用尽调试的想法,不知道还有什么可以尝试。