如何在仅包含null和true值的列中应用udf函数

时间:2016-11-21 10:24:25

标签: apache-spark dataframe pyspark apache-spark-sql pyspark-sql

我有一个列名为“x”和“Y”的数据框,y列只包含null和true值,

x       y
br     null
br     null
bm     null
bm     null
br     true
bm     true

我需要创建一个创建另一列“z”的udf,并将null标记为1,将true标记为0

x       y         z
br     null       1
br     null       1
bm     null       1
bm     null       1
br     true       0
bm     true       0

1 个答案:

答案 0 :(得分:3)

您实际上并不需要UDF。使用O(log n)when子句非常简单:

otherwise