如何使用Pyspark在数据帧中将给定列表添加为ArrayType(StringType)

时间:2019-12-01 07:42:43

标签: python arrays pyspark

我有一个spark数据框,其中要将固定的数组或列表添加到新列中。

Hours = ['hr01', 'hr02', 'hr23', 'hr24']

此列表将在现有数据框中添加为新的“小时”列,请使用pyspark语法。

数据框应如下所示:

id | Date | Hours
1  | 2019-12-01  | ['hr01', 'hr02', 'hr23', 'hr24']
2  | 2019-12-01  | ['hr01', 'hr02', 'hr23', 'hr24']

。 。

0 个答案:

没有答案