在Python中导入csv时忽略dtype异常

时间:2019-07-08 12:58:46

标签: python pandas

假设我有一个自然值变量,例如我的csv数据集中的“年龄”。由于某些值是字符串,例如“丢失”。

此代码

personal_info = pd.read_csv("Age.csv", sep=',')

给我错误

DtypeWarning: Columns (6,10) have mixed types. Specify dtype option on import or set low_memory=False.

添加dtype

personal_info = pd.read_csv("Age.csv", sep=',', error_bad_lines=False,
                               dtype={'age': int})

遇到字符串“ missing”时会爆炸。

invalid literal for int() with base 10: 'missing'

如何忽略值不在可变域中的行?

1 个答案:

答案 0 :(得分:2)

您可以使用na_values参数:

personal_info = pd.read_csv("Age.csv", sep=',', error_bad_lines=False,
                           dtype={'age': int},na_values=['missing'])