我正在使用python lxml库来解析html页面:
import lxml.html
# this might run indefinitely
page = lxml.html.parse('http://stackoverflow.com/')
有没有办法设置解析超时?
答案 0 :(得分:1)
它看起来使用urllib.urlopen
作为开启者,但最简单的方法是修改套接字处理程序的默认超时。
import socket
timeout = 10
socket.setdefaulttimeout(timeout)
当然,这是一个快速而肮脏的解决方案。