Python废弃javascript线

时间:2016-11-14 04:06:21

标签: javascript python json web-scraping

我想废弃一条包含Python中JSON数据的javascript行

AH4RSearch.listingsJSON = $.parseJSON('{"properties":[{"Price":3695,"PriceFormatted":"3,695","Street":"9251 E Bajada Road"}');

据我所知,在获得$ .parseJSON的内容后,我可以使用

  

json.loads

以JSON格式存储,但如何从javascript行获取此内容?

2 个答案:

答案 0 :(得分:1)

您可能需要re来提取数据

import re
import json
your_js_string = """AH4RSearch.listingsJSON = $.parseJSON('{"properties":[{"Price":3695,"PriceFormatted":"3,695","Street":"9251 E Bajada Road"}');"""

m = re.search(r'\$\.parseJSON\(\'(.*?)\'\);', your_js_string)
print json.loads(m.group(1))
# oh, no, your json is broken

答案 1 :(得分:0)

对于Python,它只是字符串,所以使用标准字符串函数 - 如split()或切片[start:end]

import json

text = '''AH4RSearch.listingsJSON = $.parseJSON('{"properties":[{"Price":3695,"PriceFormatted":"3,695","Street":"9251 E Bajada Road"}]}')'''

data = json.loads(text[39:-2])

print(data['properties'][0]['Price'])