我已经阅读了建立自己的数据处理程序的建议,例如:
web_view.connect('resource-request-starting', resource_cb)
def resource_cb(view, frame, resource, request, response):
print request.get_uri()
#get data using urllib with different user-agent...
request.set_uri('data:....')
(来自http://code.google.com/p/pywebkitgtk/wiki/HowDoI)
将允许您使用自定义标头/ useragent下载。但是,如果set_uri被赋予了带有null-char的字符串,或者它会给出一个错误,例如“**消息:控制台消息:(http:// url)@linenumber:SECURITY_ERR:DOM异常18:尝试是旨在突破用户代理的安全策略。“
有没有更好的方法为pygtk代码设置浏览器useragent? This表示您可以使用SoupMessage添加/删除/替换标头,但是缺少该文档......
答案 0 :(得分:1)
此代码设置一个特殊的用户代理:
http://nullege.com/codes/show/src%40p%40r%40PrisPy-HEAD%40PrisPy.py/33/webkit.WebView/python
webkit.WebSettings()允许用户代理切换以及其他一些设置,但它似乎没有添加其他标题的选项。