我从hbase获取数据并将其转换为数据帧。现在,我在数据框中有一个string
数据类型的列。但我需要将其数据类型转换为Int
。
尝试下面的代码,但它给我一个错误
df.withColumn("order", 'order.cast(int)')
我面临的错误是
error:col should be column
我在这里给出了正确的列名,我是否需要在pyspark中更改上述代码的语法?
答案 0 :(得分:2)
或者:
df.withColumn("order", df.order.cast("int"))
或
from pyspark.sql.functions import expr
df.withColumn("order", expr("CAST(order AS INTEGER)"))