pyspark:如何将列从字符串转换为分类变量?

时间:2017-08-11 06:55:11

标签: python apache-spark pyspark

我已经让教育水平作为一个专栏。 它是一个字符串。你如何将其转换为分类变量?这在pyspark中是必要的,因为在熊猫中,我告诉分类数据处理起来要快得多。

df = df.withColumn("BIRTHDAY", df['BIRTHDAY'].cast(DateType()))

我是如何stringdate的。{

0 个答案:

没有答案