如何使用python抓取网页中的超链接

时间:2011-06-06 05:28:11

标签: python html-parsing urllib2 lxml

我的网页中有

这样的结构
<div>
<ul>
<li class=tree>
<a>  </a>
</li>
</ul>
</div>

我想抓住所有这些超链接并在python中放入文本文件

2 个答案:

答案 0 :(得分:2)

答案 1 :(得分:0)

您可以使用模块xml.dom.minidom,但如果这是一个问题,它不会移植到某些版本的python3。