我正在编写一个试图确定页面上是否有广告的应用程序。目前正在使用python驱动通过selenium webdriver进行浏览。
我认为iframe中存在大量广告,我已经制作了一个循环来查看每个框架
browser = webdriver.Chrome()
browser.get("http://cnn.com")
all_iframes = browser.find_elements_by_tag_name("iframe")
for iframe in all_iframes:
browser.switch_to_frame(iframe)
print(browser.page_source)
browser.switch_to_default_content()
browser.quit()
我想知道是否有任何一致的标签或标签参数我可以在多个页面中使用,以确定页面上是否有广告(页面上的iframe内外)。我是否必须在每个框架内查找doubleclick或adtech或adblade等实例?
或者我是否必须生成不同的规则来检查每页?
有关广告如何在网页上展示的人都知道了吗?感谢。
答案 0 :(得分:5)
您可以按广告服务器进行搜索。
http://pgl.yoyo.org/as/serverlist.php?hostformat=adblockplus
查看其他项目并了解他们如何处理相同的任务会很有帮助: