如何避免在以下sparkSQL数据帧中进行混洗?

时间:2018-05-01 05:25:54

标签: scala apache-spark-sql spark-dataframe

我应该使用持久性还是更改groupBy操作?

array:2 [    
    1 => array:1 [
                0 => "sdfs,sfd,ry,fh"
         ]
    4 => array:1 [
                1 => "sdfs,sfd,ry,fh,xcz,dsf"
          ]
]

0 个答案:

没有答案