更改SparkR中spark数据帧列的dataType

时间:2016-04-05 06:12:35

标签: r apache-spark sparkr

我有一个火花数据帧。

root
 |-- col1: string (nullable = true)
 |-- Id: string (nullable = true)
 |-- col2: string (nullable = true)
 |-- col3: string (nullable = true)
 |-- col4: string (nullable = true)
 |-- date1: string (nullable = true)
 |-- col5: string (nullable = true)
 |-- date2: string (nullable = true)

我只想将date2列转换为日期。我用下面的代码来做那个

to_date(myDF$date2)

但数据框保持不变。 date2数据类型没有变化。

如何将date2列更改为dateType?

1 个答案:

答案 0 :(得分:3)

myDF <- withColumn(myDF, "date2", cast(myDF$date2, "date"))

请参阅SparkR文档中有关最新版本的这些页面(撰写本文时为2.0.1):

演员表不会更改现有的数据帧,因此您需要创建一个新的数据帧,或用新的已替换的列替换现有的数据帧,替换同名的旧列。