在Python中使用包含Unicode的报废JSON数据

时间:2017-10-18 04:51:09

标签: python json unicode scrapy

我将一些JSON数据废弃到名为' wotd-page-one.json'的文件中。使用Scrapy。 JSON数据包含一些西班牙语单词,重音字母转换为Unicode。我想加载这些数据,并在同一目录中使用python脚本使其成为usbale。我试图将此数据加载到列表中以单独处理每个JSON键和值。但是,由于我没有使用Unicode和JSON的丰富经验,因此我很难实现这一点。任何人都可以帮我找到一种方法,通过Python列表访问这些数据。理想情况下,我喜欢使它像数据[2] ==" DEF" data [3] =="字符串,任何unicode字符转换为latin-1"和数据[4] ==" SENTENCE" data [5] =="字符串,其中任何unicode字符都转换为latin-1"

3, childTest1 | 4, childTest1 | 5, childTest2 | 6, childTest2 ...

2 个答案:

答案 0 :(得分:1)

使用JSON文件,您可以在一个操作中加载它。它将变成Python结构......在这种情况下,是一个字典列表。例如:

import json

with open('wotd-page-one.json') as f:
    data = json.load(f)

for d in data:
    print(d['SENTENCE'])

输出:

No me gusta cómo silba ese señor; me da escalofríos.
"¿Hay alguien aquí?" preguntó el niño con voz sobresaltada.
Carla me hizo una mueca cuando le pregunté si tenía miedo.
El maestro golpeteó el pizarrón con la tiza.

答案 1 :(得分:0)

json文件的第一行是读"[",然后是你尝试解析它,但是引发了异常,因为这不是有效的json格式。通过逐行阅读,您忽略了文件的其余部分,因此您不应该这样做。而是像这样使用json.load

with open("wotd-page-one.json") as f:
    data = json.load(f)