在google dataprep中导入json文件

时间:2017-09-26 06:14:33

标签: json format google-cloud-dataprep

有没有人知道如何在谷歌数据准备中导入json文件? 我可以在那里上传一个json文件,但它无法创建列。

这是屏幕截图:enter image description here

你可以看到它将所有json显示为1列。

我做了一些研究,并且认为JSON应该支持其他步骤

这是文章: https://cloud.google.com/dataprep/docs/html/Supported-File-Formats_57344528

这是附加步骤文章: https://cloud.google.com/dataprep/docs/html/Splitrows-Transform_57344654

我确实尝试拆分行但它仍然无效。我必须使用任何特定格式的JSON吗?

如果您能给我一个按预期工作的json文件的简单示例,那么

会很好。

感谢。

2 个答案:

答案 0 :(得分:0)

找到答案。

示例数据:

{"name":"jonSnow","age":21,"dob":"1988-01-01","tags":["a","b"],"address":{"postcode":3122,"state":"vic"}}
{"name":"aom","age":21,"dob":"1988-02-01","tags":["c","d"],"address":{"postcode":3000,"state":"Vic"}}

当它作为数据集添加时,这些是以下步骤:(默认情况下,dataprep建议这样做)

  1. 拆分行。

    splitrows col:column1 on:'\ n'引用:'\“'quoteEscapeChar:'\”'

  2. 使用un

    创建列

    不当col:column1键:'name','age','dob','tags','address.postcode','address.state'

  3. 根据我的理解,谷歌数据准备将收到你的json字符串。所以这实际上取决于你如何导入数据集。

答案 1 :(得分:0)

我正在测试dataprep,我使用了一个非常简单的json文件。但是dataprep只是导入是一个字符串。阅读文档时,它说:“注意:Cloud Dataprep要求每行提交一个有效JSON对象的JSON文件。”

这没有任何意义。为了使用工具进行数据准备,您必须首先使用其他工具来准备数据。

https://cloud.google.com/dataprep/docs/html/Initial-Parsing-Steps_57344625