在Python中为Openrefine创建json

时间:2016-01-27 11:01:27

标签: python json openrefine

我在python中抓取资源,我想创建一个json文件,在Openrefine中使用它来清理数据。

这是我的代码:

import json
import codecs

A = xpath
B = xpath
C = xpath
D = xpath

with codecs.open('info2.json', 'a', 'utf-8-sig') as f:
    json.dump({'A': A, 'B': B, 'C': C, 'D': D}, f, sort_keys=True, indent=4, ensure_ascii=False)

可以直到我将文件上传到Openrefine:我无法点击右侧节点,但只能点击特定元素。这是一个例子:

I can click only on a specific element

我认为使用python生成json时出错,我尝试放置两个{{}}但是它给了我一个“dict”错误,所以我尝试将元素放入数组但没有任何效果。

作为请求,这里是json的一部分:

enter image description here

P.S。我正在使用编解码器,因为有非拉丁字符

1 个答案:

答案 0 :(得分:1)

要在OpenRefine导入中选择节点,您需要将数组包含在节点中 - 例如

{
  "DISTRIBUTION": [
    "JHU",
    "123"
  ],
  "IMMAGINE": {
    "IMMAGINELIST": [
      "1",
      "2",
      "3"
    ]
  }
}