我在尝试通过 pyarrow 依赖项升级时遇到导入错误。更具体地说,它因以下导入而失败:
from pyarrow import dataset as pa_ds
这将产生以下错误
<块引用>文件“[ENV]/lib/python3.8/site-packages/pyarrow/dataset.py”,第24行, 从 pyarrow._dataset 导入(#noqa ModuleNotFoundError: 没有名为“pyarrow._dataset”的模块
我在 pyarrow 3.0.0 和 2.0.0 上都遇到了这个问题。虽然相同的导入适用于 pyarrow 1.0.1。我通过 conda 安装了 pyarrow。真的不知道这里出了什么问题。
答案 0 :(得分:2)
这为我修复了该错误。请注意,我是从 source 构建的。
$ export PYARROW_WITH_DATASET=1
之前:
>>> import pyarrow
>>> import pyarrow.dataset
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
File "/Users/diana/workspace/arrow/python/pyarrow/dataset.py", line 23, in <module>
from pyarrow._dataset import ( # noqa
之后:
$ cd workspace/arrow/python/
$ export PYARROW_WITH_DATASET=1
$ python setup.py build_ext --inplace
$ python
>>> import pyarrow
>>> import pyarrow.dataset
>>>
>>> print("happy dance!")