标签: amazon-web-services web-crawler etl aws-glue
我运行了一个爬虫,它给了我以下错误:
某些文件与检测到的架构不匹配。删除或排除 以下来自抓取工具的文件:
这些文件使用gz压缩,位于s3。 所有文件都具有相同的格式,例如:
gz
s3
MSC,LL,150635,1142323,702551687172,,,,,,,,20170207,000356,0,MAD06Q1 1R15AI0,EAIMX2I,,,,,,,,,1,0,2,
有关如何修复此错误的任何想法吗?