scala将两个或多个字符串合并为一个json属性中的数组

时间:2017-02-24 01:52:34

标签: scala apache-spark

我在很多文件中都有很多json字符串行,他们喜欢:

{ "id":123, "team":"A", "etc":"...", ...}
{ "id":124, "team":"A", "etc":"...", ...}
{ "id":124, "team":"B", "etc":"...", ...}
{ "id":125, "team":"A", "etc":"...", ...}

我可以在scala中将它们作为DataFrame加载。

通过按ID分组,我希望得到:

{ "id":123, "team":"A", "etc":"...", ...}
{ "id":124, "team":["A","B"], "etc":"...", ...}
{ "id":125, "team":"A", "etc":"...", ...}

在scala中,我该怎么做?

注意:我不知道每个json中有多少个子属性。大多数属性在json线上都很常见。但是在一些json行中可以有一些独特的属性。

0 个答案:

没有答案