如何使用网络抓取识别广告的内部网址?

时间:2020-04-01 22:42:16

标签: web-scraping

我想创建一个Chrome扩展程序,以记录在您的浏览器中显示的广告的历史记录。我不知道从哪里开始。我知道,使用诸如精美汤之类的东西进行网页爬虫可以为您提供页面的网址。您如何知道哪些链接来自广告? (诸如AdSense之类的产品可让您在自己的网站上找到相关信息,但我想为用户创建广告历史记录)

在更高的层次上,您如何将这些广告归类为相似的主题(例如游戏,音乐等)(这需要机器学习吗?)

0 个答案:

没有答案