我试图解析json数据,但它没有工作,json解析器返回一个强大而不是字典! 代码如下:
import urllib2
from BeautifulSoup import BeautifulSoup
import json
html = urllib2.urlopen("http://www.imdb.com//name/nm0425005/mediaviewer/rm244453632?ref_=nmmi_mi_all_sf_49").read()
soup = BeautifulSoup(html)
script = soup.find('script', {'id': 'imageJson'})
json_data = ''.join(map(str, script.contents))
json_data = json.dumps(json_data.strip(' \t\n\r'))
data = json.loads(json_data)
print data['mediaViewerModel']
答案 0 :(得分:1)
json_data = ''.join(map(str, script.contents))
>>> json_data = json.dumps(json_data.strip(' \t\n\r'))
data = json.loads(json_data)
标记的行是问题所在。 json_data
当前是一个字典编码字典,当你调用json.dumps
时,它将是一个字符串,编码一个字典编码字典,你的最后一行只撤消一个实例。你实际上试图用标记的线做什么?