我正在尝试使用here中所述的pyarrow的流读取器读取大型拼花机文件。
但是我收到以下错误:
module 'pyarrow' has no attribute 'StreamReader'
我已经尝试过切换到RecordBatchStreamReader,但似乎不是直接读取Parquet文件而已。
我正在使用pyarrow 0.14。
答案 0 :(得分:0)
RecordBatchStreamReader
用于读取Arrow二进制协议,而不用于Parquet文件。尝试使用pyarrow.parquet.read_table