导入 pyarrow 时出现 ModuleNotFoundError

时间:2021-02-04 20:15:05

标签: python

我在尝试通过 pyarrow 依赖项升级时遇到导入错误。更具体地说,它因以下导入而失败:

from pyarrow import dataset as pa_ds

这将产生以下错误

<块引用>

文件“[ENV]/lib/python3.8/site-packages/pyarrow/dataset.py”,第24行, 从 pyarrow._dataset 导入(#noqa ModuleNotFoundError: 没有名为“pyarrow._dataset”的模块

我在 pyarrow 3.0.0 和 2.0.0 上都遇到了这个问题。虽然相同的导入适用于 pyarrow 1.0.1。我通过 conda 安装了 pyarrow。真的不知道这里出了什么问题。

1 个答案:

答案 0 :(得分:2)

这为我修复了该错误。请注意,我是从 source 构建的。

$ export PYARROW_WITH_DATASET=1

之前:

>>> import pyarrow
>>> import pyarrow.dataset
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
  File "/Users/diana/workspace/arrow/python/pyarrow/dataset.py", line 23, in <module>
    from pyarrow._dataset import (  # noqa

之后:

$ cd workspace/arrow/python/
$ export PYARROW_WITH_DATASET=1
$ python setup.py build_ext --inplace
$ python
>>> import pyarrow
>>> import pyarrow.dataset
>>> 
>>> print("happy dance!")