熊猫Read_Parquet NaN错误:ValueError:无法将float NaN转换为整数

时间:2020-07-07 10:05:06

标签: python python-3.x pandas parquet

在读取Python3中的实木复合地板文件时遇到的 NaN 错误时,我需要帮助。 当我尝试读取文件时,有一列返回“ NaN ”。 根据要求,我无法更改此文件的内容-因此,我无法处理有问题的列。

这是我用来读取文件的代码:

df = pd.read_parquet("parquet_file.parquet")

这是错误:

ValueError: cannot convert float NaN to integer

谢谢。

2 个答案:

答案 0 :(得分:1)

遇到类似问题,我发现解决方案(以我为例)是pip install pyarrow。 read_parquet的文档中提到了engine参数。 auto是默认设置,如果无法使用pyarrow,则使用fastparquet库。

pip安装pyarrow然后重新运行代码似乎可以解决问题

答案 1 :(得分:0)

pandas.read_parquet(parquet_file.parquet,columns = [column1,column2])

您可以从文件中指定要处理的列的列表,排除存在问题的列