假设我有一个自然值变量,例如我的csv数据集中的“年龄”。由于某些值是字符串,例如“丢失”。
此代码
personal_info = pd.read_csv("Age.csv", sep=',')
给我错误
DtypeWarning: Columns (6,10) have mixed types. Specify dtype option on import or set low_memory=False.
添加dtype
personal_info = pd.read_csv("Age.csv", sep=',', error_bad_lines=False,
dtype={'age': int})
遇到字符串“ missing”时会爆炸。
invalid literal for int() with base 10: 'missing'
如何忽略值不在可变域中的行?
答案 0 :(得分:2)
您可以使用na_values
参数:
personal_info = pd.read_csv("Age.csv", sep=',', error_bad_lines=False,
dtype={'age': int},na_values=['missing'])