Python Scrapy获取错误JSONDecodeError:解码json字符串时,必须用逗号分隔值

时间:2016-01-20 16:17:13

标签: python-2.7 scrapy scrapy-spider

我正在尝试使用demjson库解码json字符串,我收到一个错误 - “JSONDecodeError:值必须用逗号分隔”。我正在使用python scrapy框架废弃一个网站,我正在使用正则表达式从源代码中获取json字符串,这是我要解码的json字符串。

{
    'customerId':'',
    'productTitle':"Art & Funclay" Length 8cm. 12 Sticks",
    'price': '135',
    'categoryId': 'test',
    'availability': 'test',
    'sku':'BPSIM00140',
    'departmentName': "test",
    'categoryName': "a",
    'subCategoryName': "test",
    'brandName':"test",
    'pageURL':"test"
}

我希望错误是因为额外的“in'productTitle':”Art& Funclay“长8厘米.12支”。那么如何解码json字符串?

提前致谢

1 个答案:

答案 0 :(得分:1)

s = """
{
    'customerId':'',
    'productTitle':"Art & Funclay" Length 8cm. 12 Sticks",
    'price': '135',
    'categoryId': 'test',
    'availability': 'test',
    'sku':'BPSIM00140',
    'departmentName': "test",
    'categoryName': "a",
    'subCategoryName': "test",
    'brandName':"test",
    'pageURL':"test"
}
"""
s = re.sub(r"'productTitle':\s*\"(.+?)\",", "'productTitle': '\\1',", s)
json_obj = demjson.decode(s)