使用python从airtel进行Web抓取

时间:2014-04-27 10:11:16

标签: python web-scraping

通过python登录网页Ortel Website并抓取下一页Data usage page

所以,我使用了这段代码:

username = '0000000' 
password = 'password'
cj = cookielib.CookieJar()
opener = urllib2.build_opener(urllib2.HTTPCookieProcessor(cj))
login_data = urllib.urlencode({'txtMembNumb' : username, 'txtMembPass' : password})
opener.open('http://cm.ortel.net', login_data)
resp = opener.open('http://cm.ortel.net/index.asp')
print resp.read()

它返回错误

[Decode error - output not utf-8]
  

更新:抱歉上面的问题是因为崇高的文本编辑器。但是这个程序给了我登录页面的HTML文件,但我想要下一页。

1 个答案:

答案 0 :(得分:0)

看看你的输出在函数

  

解码(" UTF8&#34)

喜欢::

output.decode("utf8")