我试图运行以下命令:
df = df.withColumn("DATATmp", to_date($"DATA", "yyyyMMdd"))
收到此错误:
<console>:34: error: too many arguments for method to_date: (e: org.apache.spark.sql.Column)org.apache.spark.sql.Column
如何指定要导入的确切功能?有另一种方法可以避免这种错误吗?
编辑:Spark版本2.1
答案 0 :(得分:5)
可以看到in the detailed scaladoc,在2.2.0中添加了带有两个参数的to_date
函数,而从1.5开始存在单参数版本。
如果您使用较旧的Spark版本,请升级或不使用此功能。