在数据框中,我有一列名为parent_asset_xid
。
我想创建一个新列parent_asset_sk
,如果md5(parent_asset_xid)
为00000000-0000-0000-0000-000000000000
,则该列将为parent_asset_xid
或null
。
我正在尝试类似的操作,但不确定如何将md5
部分集成到此
mydf.withColumn(
"parent_asset_sk",
when($"parent_asset_xid".isnull, "00000000-0000-0000-0000-000000000000")
)
答案 0 :(得分:0)
您已了解了大部分内容,只需向您otherwise
添加一个when
,
val newDF = yourDF.withColumn(
"parent_asset_sk",
when(
col("parent_asset_xid").isNotNull,
md5(col("parent_asset_xid"))
).otherwise(lit("00000000-0000-0000-0000-000000000000"))
)