如何在pandas dataframe中定义默认缺失值

时间:2017-02-04 19:09:27

标签: python pandas

我想读取具有给定数据类型和缺失值的数据帧,但后面的代码是错误的。我不知道,为什么会这样呢!

myText = StringIO("""1,2
3,\N
5,6""")

myDf = pd.read_csv(myText, header=None, names=["a1","a2"], na_values=["\N"], dtype={"a1":"int", "a2":"int"})

我收到了错误消息:

ValueError: Integer column has NA values in column 1

如果我删除了dtype选项dtype={"a1":"int", "a2":"int"},那么它可以正常工作。整数列是否不允许缺少值?

1 个答案:

答案 0 :(得分:3)

整数不允许缺少值。 Float允许缺少值。如果你需要它是整数,你需要使用一个哨兵,如0或99999999或其他东西(不推荐)。否则,使用像float64这样的类型,允许像NaN这样的带外值。