我在python中抓取资源,我想创建一个json文件,在Openrefine中使用它来清理数据。
这是我的代码:
import json
import codecs
A = xpath
B = xpath
C = xpath
D = xpath
with codecs.open('info2.json', 'a', 'utf-8-sig') as f:
json.dump({'A': A, 'B': B, 'C': C, 'D': D}, f, sort_keys=True, indent=4, ensure_ascii=False)
可以直到我将文件上传到Openrefine:我无法点击右侧节点,但只能点击特定元素。这是一个例子:
我认为使用python生成json时出错,我尝试放置两个{{}}但是它给了我一个“dict”错误,所以我尝试将元素放入数组但没有任何效果。
作为请求,这里是json的一部分:
P.S。我正在使用编解码器,因为有非拉丁字符
答案 0 :(得分:1)
要在OpenRefine导入中选择节点,您需要将数组包含在节点中 - 例如
{
"DISTRIBUTION": [
"JHU",
"123"
],
"IMMAGINE": {
"IMMAGINELIST": [
"1",
"2",
"3"
]
}
}