我已经使用下面的代码将spark数据帧转换为pandas数据帧。
trainDF=df.toPandas()
其中df是spark数据帧,trainDF是pandas数据帧。
但是问题是,pandas数据框中每一列的所有数据类型都变成对象。
44640 non-null object
44640 non-null object
44640 non-null object
44640 non-null object
44640 non-null object
1440 non-null object
44640 non-null object
44640 non-null object
44640 non-null object
44640 non-null object
44640 non-null object
尝试使用推断对象功能将其转换为实际的数据类型,但仍然没有运气。
trainDF=trainDF.infer_objects()
有什么方法可以根据列的实际内容更改数据类型。