我正在从网络设备中检索xml文件。如果我没有指定用户代理,它将以不同的格式返回文件而不使用html标记。
import urllib
urllib.urlretrieve(url,file_save_name)
如何在检索时指定用户代理?
答案 0 :(得分:0)
听起来你可以做到。
import urllib
# User-Agents for multiple browsers and OS's
user_agents = [ 'Mozilla/5.0 (Windows; U; Windows NT 5.1; it; rv:1.8.1.11) Gecko/20071127 Firefox/2.0.0.11', 'Opera/9.25 (Windows NT 5.1; U; en)', 'Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; SV1; .NET CLR 1.1.4322; .NET CLR 2.0.50727)', 'Mozilla/5.0 (compatible; Konqueror/3.5; Linux) KHTML/3.5.5 (like Gecko) (Kubuntu)', 'Mozilla/5.0 (X11; U; Linux i686; en-US; rv:1.8.0.12) Gecko/20070731 Ubuntu/dapper-security Firefox/1.5.0.12', 'Lynx/2.8.5rel.1 libwww-FM/2.14 SSL-MM/1.4.1 GNUTLS/1.2.9'
# Add user_agent as header argument.
urllib.urlretrieve (url, file_save_name, user_agent)