我有一个要导入到pandas dataframe
的大表,并且在导入期间它抛出了DtypeWarning
。我当然可以在导入后指定dtype:
for col in list(df.columns[1:]):
df[col] = df[col].astype("object")
df["id"]= df["id"].astype("int")
但是,来自here的代码应该已经在导入步骤中完成了,涉及到性能。
因此,如何在dtype
的参数dtype
中为我的大表指定pandas.read_csv
?如上例所示,除列object
外,所有列均应为id
。
更新:当用户Shijith提及某条帖子时,首先读取列名并将其更改为dict
的{{1}}即可。
dtype
但是,我不确定这是否有效?