我在很多文件中都有很多json字符串行,他们喜欢:
{ "id":123, "team":"A", "etc":"...", ...}
{ "id":124, "team":"A", "etc":"...", ...}
{ "id":124, "team":"B", "etc":"...", ...}
{ "id":125, "team":"A", "etc":"...", ...}
我可以在scala中将它们作为DataFrame加载。
通过按ID分组,我希望得到:
{ "id":123, "team":"A", "etc":"...", ...}
{ "id":124, "team":["A","B"], "etc":"...", ...}
{ "id":125, "team":"A", "etc":"...", ...}
在scala中,我该怎么做?
注意:我不知道每个json中有多少个子属性。大多数属性在json线上都很常见。但是在一些json行中可以有一些独特的属性。