我正在尝试使用scrapy抓取网站,但网站结构不一致

时间:2019-12-22 15:08:06

标签: web-scraping scrapy

我必须抓取多个相似的页面,但是在某些页面上,主要内容位于span标记中,而在其他页面上,其主要内容位于p标记中。在某些页面上,两个标签都被使用。我可以通过某种方式为所有页面编写通用脚本吗?

1 个答案:

答案 0 :(得分:-1)

这不是我们可以使用提供的信息真正回答的问题。但是,如果页面内容有点不一致(但是有些一致),则可以随时抓住所有可能的情况,然后解析数据。这将需要一些良好的异常管理。

我发现您是该网站的新手,请尝试提供更多信息,包括示例,您尝试过的操作以及下次的预期行为:)。