从包装的数组scala创建新的数据框

时间:2018-07-25 10:06:05

标签: scala apache-spark

我有一个类似于以下内容的数据框:

+-------------------------------------+--------------------+
|left                                 |right               |
+-------------------------------------+--------------------+
|[WrappedArray(1)]                    |[WrappedArray(2)]   |
|[WrappedArray(1)]                    |[WrappedArray(2, 3)]|
|[WrappedArray(1), WrappedArray(2, 3)]|[WrappedArray(2)]   |
|[WrappedArray(1), WrappedArray(2, 3)]|[WrappedArray(2, 1)]|
+-------------------------------------+--------------------+

我需要创建另一个数据框,如下所示:

+-------------------------------------+--------------------+
|left                                 |right               |
+-------------------------------------+--------------------+
|1                                    |2                   |
|1                                    |2*3                 |
|1&2*2                                |2                   |
|1&2*3                                |2*3                 |
+-------------------------------------+--------------------+

这里的数组元素用&分隔,内部数组的元素用*分隔。

例如:

[WrappedArray(1,2,34), WrappedArray(2, 3)]

1*2,34&2*3

0 个答案:

没有答案