在读取Python3中的实木复合地板文件时遇到的 NaN 错误时,我需要帮助。 当我尝试读取文件时,有一列返回“ NaN ”。 根据要求,我无法更改此文件的内容-因此,我无法处理有问题的列。
这是我用来读取文件的代码:
df = pd.read_parquet("parquet_file.parquet")
这是错误:
ValueError: cannot convert float NaN to integer
谢谢。
答案 0 :(得分:1)
遇到类似问题,我发现解决方案(以我为例)是pip install pyarrow。
read_parquet
的文档中提到了engine
参数。 auto
是默认设置,如果无法使用pyarrow,则使用fastparquet库。
pip安装pyarrow然后重新运行代码似乎可以解决问题
答案 1 :(得分:0)
pandas.read_parquet(parquet_file.parquet,columns = [column1,column2])
您可以从文件中指定要处理的列的列表,排除存在问题的列