Question

我有一个数据框，我使用df1 = spark.read.csv("/user/me/data/*").toPandas()读取了：

Object

不幸的是，pyspark将所有类型都保留为df2 = pd.read_csv("file.csv")，甚至是数值。我需要将其与我使用df1读入的另一个数据框合并，因此我需要将this.state = { activeImage: newImage }中的类型推断为与pandas完全相同的推断。

如何推断现有pandas数据框的类型？

Answer 1

如果您使用相同的列名，则可以使用pd.DataFrame.astype：

var myDouble = Properties.Settings.Default.MyDouble;

否则，您需要构建一个字典，其中键是df1 = df1.astype(df2.dtypes)中的列名称，值为df1。您可以从dtypes开始查看它应该是什么样子。然后构建一个新的字典，在需要的地方更改密钥。

构建字典d = df2.dtypes.to_dict()后，请使用：

如何推断pandas数据帧中的类型

1 个答案: