pyarrow读取流导致模块“ pyarrow”中没有属性“ StreamReader”

时间:2019-07-18 08:09:27

标签: parquet pyarrow

我正在尝试使用here中所述的pyarrow的流读取器读取大型拼花机文件。
但是我收到以下错误:

module 'pyarrow' has no attribute 'StreamReader'

我已经尝试过切换到RecordBatchStreamReader,但似乎不是直接读取Parquet文件而已。

我正在使用pyarrow 0.14。

1 个答案:

答案 0 :(得分:0)

RecordBatchStreamReader用于读取Arrow二进制协议,而不用于Parquet文件。尝试使用pyarrow.parquet.read_table

http://arrow.apache.org/docs/python/parquet.html