标签: python apache-spark pyspark
我已经让教育水平作为一个专栏。 它是一个字符串。你如何将其转换为分类变量?这在pyspark中是必要的,因为在熊猫中,我告诉分类数据处理起来要快得多。
df = df.withColumn("BIRTHDAY", df['BIRTHDAY'].cast(DateType()))
我是如何string到date的。{
string
date