设置超时以使用python lxml解析网页

时间:2010-05-05 02:48:50

标签: python lxml

我正在使用python lxml库来解析html页面:

import lxml.html

# this might run indefinitely
page = lxml.html.parse('http://stackoverflow.com/')

有没有办法设置解析超时?

1 个答案:

答案 0 :(得分:1)

它看起来使用urllib.urlopen作为开启者,但最简单的方法是修改套接字处理程序的默认超时。

import socket
timeout = 10
socket.setdefaulttimeout(timeout)

当然,这是一个快速而肮脏的解决方案。