如何将行(字符串数组)转换为数据框列

时间:2019-06-03 21:47:14

标签: arrays scala apache-spark apache-spark-sql

我有一个只有一列和一排字符串数组的数据框,例如:

   +---------------------------------------+
   |     col1                              |
   +---------------------------------------+
   |[st1,  st2, st3, st4, st5, st6,  st7...|
   +---------------------------------------+

我想将其转换为具有一列但又多行的新数据帧,如下所示:每一行都具有字符串数组中的一项,如下所示:

   +-----------+
   |     col1  |
   +-----------+
   | st1       |
   +-----------+
   | st2       |
   +-----------+
   | st3       |
   +-----------+
   | st4       |
   +-----------+
   | st5       |
   +-----------+
   | st6       |
   +-----------+
   | st7       |
   +-----------+
   | ...       |
   +-----------+
   | ...       |
   +-----------+

任何建议都值得赞赏。

   scala> df.printSchema
      root
         |-- col1: array (nullable = true)
         |    |-- element: string (containsNull = true)

0 个答案:

没有答案