Question

在读取Python3中的实木复合地板文件时遇到的 NaN 错误时，我需要帮助。当我尝试读取文件时，有一列返回“ NaN ”。根据要求，我无法更改此文件的内容-因此，我无法处理有问题的列。

这是我用来读取文件的代码：

df = pd.read_parquet("parquet_file.parquet")

这是错误：

ValueError: cannot convert float NaN to integer

谢谢。

Answer 1

遇到类似问题，我发现解决方案（以我为例）是pip install pyarrow。 read_parquet的文档中提到了engine参数。 auto是默认设置，如果无法使用pyarrow，则使用fastparquet库。

pip安装pyarrow然后重新运行代码似乎可以解决问题

Answer 2

pandas.read_parquet（parquet_file.parquet，columns = [column1，column2]）

您可以从文件中指定要处理的列的列表，排除存在问题的列