在GREL中解析多值JSON(OpenRefine)

时间:2017-01-06 08:52:29

标签: json foreach openrefine grel

我有一个包含以下内容的专栏:

7. {"resource":"abc"}
8. [{"resource":"def"},{"resource":"ghi"}]

我尝试获取“资源”的内容:

value.parseJson().resource

作品。如果我试图获取多值单元格的内容,我无法让它工作。我根据https://github.com/OpenRefine/OpenRefine/wiki/GREL-Other-Functions尝试了:

forEach(value.parseJson().resource,v,v.resource)

我收到很多错误,例如:

7.  {"resource":"abc"}  Error: First argument to forEach is not an array
8.  [{"resource":"def"},{"resource":"ghi"}] Error: Object does not have any field, including resource

我只能获得多值单元格,但不能获得单值单元格:

forEach(value.parseJson(),v,v.resource)

1 个答案:

答案 0 :(得分:2)

您遇到的问题是包含JSON数组(即多个值)的单元格与不包含JSON数组的单元格之间存在差异。

有不同的方法可以解决这个问题,最好的方法可能取决于整体数据的一致性。

我的第一个建议是使用过滤器或构面分别处理单个值和数组单元格。鉴于您在示例中使用的数据,我认为以下内容可行:

1)使用GREL

在列上创建自定义文本构面
value.startsWith("[")

2)从构面中选择“false”以使用单值单元格 3)对于这些细胞,使用GREL

value.parseJson().resource

4)从构面中选择“true”以使用阵列单元格 5)对于这些细胞,使用GREL

forEach(value.parseJson(),v,v.resource)

(n.b。这与您在提问时提到的GREL略有不同)

6)此GREL的输出是OpenRefine数组。您需要将其转换为字符串以将输出存储在单元格中 - 因此您可能需要使用以下内容:

forEach(value.parseJson(),v,v.resource).join("|")