熊猫:有效地加载大表(无需获取DtypeWarning)

时间:2019-04-29 08:48:48

标签: python pandas

我有一个要导入到pandas dataframe的大表,并且在导入期间它抛出了DtypeWarning。我当然可以在导入后指定dtype:

for col in list(df.columns[1:]):
    df[col] = df[col].astype("object")
df["id"]= df["id"].astype("int")

但是,来自here的代码应该已经在导入步骤中完成了,涉及到性能。

因此,如何在dtype的参数dtype中为我的大表指定pandas.read_csv?如上例所示,除列object外,所有列均应为id

更新:当用户Shijith提及某条帖子时,首先读取列名并将其更改为dict的{​​{1}}即可。

dtype

但是,我不确定这是否有效?

0 个答案:

没有答案