应用错误收集

这称为广泛爬行，一般来说，由于网站使用不同的性质，表现形式和加载机制，这不是一件容易实现的事情。

一般的想法是拥有一个通用的蜘蛛和某种特定于站点的配置，你可以在项目字段和xpath表达式或用于从页面中检索字段值的CSS选择器之间进行映射。在现实生活中，事情并不像看起来那么简单，有些字段需要后处理，其他字段需要在发送单独请求后提取等等。换句话说，它很难保持通用且可靠的同时。

通用蜘蛛应该会收到目标网站 as a parameter ，阅读特定于网站的配置并根据它抓取网站。

另见：