我有一个spark数据框,其中要将固定的数组或列表添加到新列中。
Hours = ['hr01', 'hr02', 'hr23', 'hr24']
此列表将在现有数据框中添加为新的“小时”列,请使用pyspark语法。
数据框应如下所示:
id | Date | Hours
1 | 2019-12-01 | ['hr01', 'hr02', 'hr23', 'hr24']
2 | 2019-12-01 | ['hr01', 'hr02', 'hr23', 'hr24']
。 。