如何定义Spark中来自熊猫的所有列的数据类型?

时间:2019-01-10 14:38:44

标签: pandas apache-spark pyspark

我需要定义spark.createDataFrame()中的列类型。例如,我需要定义“年龄”和“体重”列的格式,并使用以下代码:

from pyspark.sql.types import IntegerType, FloaType

Age1 = Spark.createDataFrame(df['Age'], IntegerType ())
Weight1 = Spark.createDataFrame(df['Weight'], FloatType ())

我如何在单个spark.createDataFrame中执行而不是创建两个?

0 个答案:

没有答案