标签: dask
我对Dask并不陌生,大部分文件都放在Avro(从PySpark迁移)中。我尝试使用摄入量(顺序),设法读取并执行take(1)显示正确的数据。
由于我的“ None”列很多,当我转换为数据框时,它总是给我
ValueError:无法将非有限值(NA或inf)转换为整数
我不确定我做得对吗?