如何推断pandas数据帧中的类型

时间:2017-09-18 15:25:46

标签: python pandas apache-spark pyspark

我有一个数据框,我使用df1 = spark.read.csv("/user/me/data/*").toPandas() 读取了:

Object

不幸的是,pyspark将所有类型都保留为df2 = pd.read_csv("file.csv"),甚至是数值。我需要将其与我使用df1读入的另一个数据框合并,因此我需要将this.state = { activeImage: newImage } 中的类型推断为与pandas完全相同的推断。

  

如何推断现有pandas数据框的类型?

1 个答案:

答案 0 :(得分:2)

如果您使用相同的列名,则可以使用pd.DataFrame.astype

var myDouble = Properties.Settings.Default.MyDouble;

否则,您需要构建一个字典,其中键是df1 = df1.astype(df2.dtypes) 中的列名称,值为df1。您可以从dtypes开始查看它应该是什么样子。然后构建一个新的字典,在需要的地方更改密钥。

构建字典d = df2.dtypes.to_dict()后,请使用:

d