在python中获取广告网址

时间:2012-11-02 22:39:17

标签: python url

有没有办法可以使用python从网页中检索广告网址? 例如(http://www.quiltingboard.com/resources/)我想在顶部和右侧检索广告的网址。这可能吗?

2 个答案:

答案 0 :(得分:1)

您可以使用任何pythons html解析器。我最喜欢的是lxml,因为它很快,但它需要外部依赖...

此外,如果您要在任何网站上寻找广告,您可能需要list of add domains

答案 1 :(得分:0)

你最好的选择是使用Beautiful Soup(PyPI名称beautifulsoup4) - 它提供了一个很好的界面,可以从页面中获得你想要的东西。文档为here。它可以使用几种不同的HTML / XML解析器,从内置的东西到html5liblxml