使用PySpark将列转换为小写

时间:2020-02-25 17:08:55

标签: apache-spark pyspark lowercase

我想将所有值转换为“通道”列中的小写字母。我在Jupyter Notebook中使用PySpark创建了df。我已经尝试过here中的代码,但是遇到了错误。所以它不是重复的。

我的数据如下:

id     Channel     Brand
123    Hair        Fashion
124    Nails       Fashion 

我希望它是以下内容:

id     Channel     Brand
123    hair        Fashion
124    nails       Fashion 

我尝试了以下操作:

new_df = df.select(lower(df.Channel)).alias('Channel')

将值转换为小写字母,但我丢失了其他列。

1 个答案:

答案 0 :(得分:1)

您可以做到:

new_df = df.withColumn('Channel', lower(df.Channel))

这还将保留其他列。