如何从网站上删除2级网页

时间:2019-09-26 14:31:27

标签: python sql web-scraping beautifulsoup scrapy

我想问你如何使用python +漂亮的汤或Scrapy来剪贴网页,例如,如果有2个级别的页面,简短的说明+到职位详细信息的链接,其中包含职位公告?我需要从职位公告的标题中删除数据,然后更深入地提取完整的描述,然后将该数据添加到数据库或文本文件中?问题出在第二层,那里有完整的描述并获得完整的细节,包括图像链接(如果存在)... 有人这样做吗?

谢谢。

1 个答案:

答案 0 :(得分:0)

检查:

如果我了解您想要做什么,那么我会保存您需要的... companyName,说明,第二链接等

然后针对每个保存的公司,向secondLink发出请求并保存/设置信息