我是大熊猫的新手,我开始尝试阅读完全由1
和0
组成的表格,并且我使用read_csv
这样做的功能。一切顺利,我得到一个带有int64的DataFrame作为列类型。当我引入NaN
值时会出现问题。在这种情况下,我得到一个列类型为float64
的DataFrame。这是预期的行为吗? NaN
值是否与int
类型不兼容?
我还试图通过执行DataFrame(data, dtype=numpy.int64)
来使用float列来转换DataFrame,但在这种情况下,我会得到类似的内容:
col1 col2
row1 -9223372036854775808 1
row2 1 0
答案 0 :(得分:1)
不幸的是,整数dtype列不支持NAs / NaN(http://pandas.pydata.org/pandas-docs/stable/gotchas.html#support-for-integer-na)。但你描述的第二件事是一个错误。创建一个关于它的GitHub问题: