Question

我正在使用python lxml库来解析html页面：

import lxml.html

# this might run indefinitely
page = lxml.html.parse('http://stackoverflow.com/')

有没有办法设置解析超时？

Answer 1

它看起来使用urllib.urlopen作为开启者，但最简单的方法是修改套接字处理程序的默认超时。

import socket
timeout = 10
socket.setdefaulttimeout(timeout)

当然，这是一个快速而肮脏的解决方案。