我有一个数据框,我使用df1 = spark.read.csv("/user/me/data/*").toPandas()
读取了:
Object
不幸的是,pyspark将所有类型都保留为df2 = pd.read_csv("file.csv")
,甚至是数值。我需要将其与我使用df1
读入的另一个数据框合并,因此我需要将this.state = {
activeImage: newImage
}
中的类型推断为与pandas完全相同的推断。
如何推断现有pandas数据框的类型?
答案 0 :(得分:2)
如果您使用相同的列名,则可以使用pd.DataFrame.astype
:
var myDouble = Properties.Settings.Default.MyDouble;
否则,您需要构建一个字典,其中键是df1 = df1.astype(df2.dtypes)
中的列名称,值为df1
。您可以从dtypes
开始查看它应该是什么样子。然后构建一个新的字典,在需要的地方更改密钥。
构建字典d = df2.dtypes.to_dict()
后,请使用:
d