如何在数据框中转换列?

时间:2018-02-02 09:35:03

标签: apache-spark dataframe pyspark apache-spark-sql

我从hbase获取数据并将其转换为数据帧。现在,我在数据框中有一个string数据类型的列。但我需要将其数据类型转换为Int

尝试下面的代码,但它给我一个错误

df.withColumn("order", 'order.cast(int)')

我面临的错误是

error:col should be column

我在这里给出了正确的列名,我是否需要在pyspark中更改上述代码的语法?

1 个答案:

答案 0 :(得分:2)

或者:

df.withColumn("order", df.order.cast("int"))

from pyspark.sql.functions import expr

df.withColumn("order", expr("CAST(order AS INTEGER)"))