我想读取具有给定数据类型和缺失值的数据帧,但后面的代码是错误的。我不知道,为什么会这样呢!
myText = StringIO("""1,2
3,\N
5,6""")
myDf = pd.read_csv(myText, header=None, names=["a1","a2"], na_values=["\N"], dtype={"a1":"int", "a2":"int"})
我收到了错误消息:
ValueError: Integer column has NA values in column 1
如果我删除了dtype选项dtype={"a1":"int", "a2":"int"}
,那么它可以正常工作。整数列是否不允许缺少值?
答案 0 :(得分:3)
整数不允许缺少值。 Float允许缺少值。如果你需要它是整数,你需要使用一个哨兵,如0或99999999或其他东西(不推荐)。否则,使用像float64这样的类型,允许像NaN这样的带外值。