Recenetly我一直在做网络蜘蛛的乐趣。我想学习如何使用验证码登录网站。我学到的一种方法是使用cookies。所以我试了一下。但我意识到了一个问题。 例如,我想使用request.session获取网址:www.lovetvshow.com 我可以获得所有的html文本,但是当我试图将它转换为Json时,它失败了。它始终显示“[ValueError]无法解码JSON对象”。但我已经有了这个文本。为什么它没有json对象?
session = requests.session()
login_data = {'email': email, 'password': password}
header = {
'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/63.0.3239.132 Safari/537.36',
'Host': 'www.lovetvshow.com'
}
# r = session.post('http://www.renren.com/', data=login_data, headers=header)
r = session.get('http://www.lovetvshow.com/',headers=header)
print r
print r.json()
这将产生:
<Response [200]>
Traceback (most recent call last):
File "C:/Users/Hao/PycharmProjects/WebSpiderTutorial1/WebSpiderTutorial1.py", line 128, in <module>
requests_session, requests_cookies = create_session()
File "C:/Users/Hao/PycharmProjects/WebSpiderTutorial1/WebSpiderTutorial1.py", line 104, in create_session
print r.json()
File "C:\Python27\lib\site-packages\requests\models.py", line 892, in json
return complexjson.loads(self.text, **kwargs)
File "C:\Python27\lib\json\__init__.py", line 338, in loads
return _default_decoder.decode(s)
File "C:\Python27\lib\json\decoder.py", line 365, in decode
obj, end = self.raw_decode(s, idx=_w(s, 0).end())
File "C:\Python27\lib\json\decoder.py", line 383, in raw_decode
raise ValueError("No JSON object could be decoded")
ValueError: No JSON object could be decoded
有什么建议吗?谢谢你的头。
答案 0 :(得分:0)
您必须确保要解码JSON。使用检查完整的文本
打印print r.text
。并寻找你的json