OSError:[E050]找不到型号“ en”

时间:2019-09-23 06:51:09

标签: python nlp spacy

我正在尝试使用python- https://github.com/DerwenAI/pytextrank/blob/master/example.ipynb的pytextrank库  但是我无法解决此错误,早些时候我遇到了找不到ip.json的错误,但后来得到解决

    import pytextrank
    import sys
    path_stage0="data/ip.json" 
    path_stage1="o1.json"

    with open(path_stage1,'w') as f:
        for graf in pytextrank.parse_doc(pytextrank.json_iter(path_stage0)):
            f.write("%s\n" % pytextrank.pretty_print(graf._asdict()))
            print(pytextrank.pretty_print(graf))


    OSError                                   Traceback (most recent call last)
    <ipython-input-12-a20b437ea0f1> in <module>
          6 
          7 with open(path_stage1,'w') as f:
    ----> 8     for graf in pytextrank.parse_doc(pytextrank.json_iter(path_stage0)):
          9         f.write("%s\n" % pytextrank.pretty_print(graf._asdict()))
         10         print(pytextrank.pretty_print(graf))

~\Anaconda3\lib\site-packages\pytextrank\pytextrank.py in parse_doc(json_iter)
    259                 print("graf_text:", graf_text)
    260 
--> 261             grafs, new_base_idx = parse_graf(meta["id"], graf_text, base_idx)
    262             base_idx = new_base_idx
    263 

~\Anaconda3\lib\site-packages\pytextrank\pytextrank.py in parse_graf(doc_id, graf_text, base_idx, spacy_nlp)
    185     if not spacy_nlp:
    186         if not SPACY_NLP:
--> 187             SPACY_NLP = spacy.load("en")
    188 
    189         spacy_nlp = SPACY_NLP

~\Anaconda3\lib\site-packages\spacy\__init__.py in load(name, **overrides)
     25     if depr_path not in (True, False, None):
     26         deprecation_warning(Warnings.W001.format(path=depr_path))
---> 27     return util.load_model(name, **overrides)
     28 
     29 

~\Anaconda3\lib\site-packages\spacy\util.py in load_model(name, **overrides)
    137     elif hasattr(name, "exists"):  # Path or Path-like to model data
    138         return load_model_from_path(name, **overrides)
--> 139     raise IOError(Errors.E050.format(name=name))
    140 
    141 

OSError: [E050] Can't find model 'en'. It doesn't seem to be a shortcut link, a Python package or a valid path to a data directory.

6 个答案:

答案 0 :(得分:1)

模型名称已更改,因此需要下载en_core_web_sm或其他模型。该问题已在v1.2.1版本中得到解决,该版本更新为spaCy 2.x。

答案 1 :(得分:1)

对我来说,问题是通过安装en软件包解决的:

python -m spacy download en

我遇到以下错误:

OSError:[E050]找不到模型'en_core_web_sm'。它似乎不是快捷方式链接,Python包或数据目录的有效路径。

答案 2 :(得分:0)

使用spacy时,我们必须使用

下载模型
python -m spacy download en_core_web_sm

如果已经完成此操作,请确保已正确分配了快捷链接。意思是“ en”和“ en_core_web_sm”之间的simlink

当我直接使用spacy时容易工作的hack

nlp = spacy.load("en_core_web_sm")

更多帮助,https://spacy.io/usage/models

答案 3 :(得分:0)

使用以下命令解决了笔记本上的错误

!python -m spacy download en_core_web_md

您可以根据自己的要求下载软件包,例如:

!python -m spacy download en_core_web_sm'

!python -m spacy download en_core_web_lg

答案 4 :(得分:0)

尝试使用以下命令:

spacy.cli.download("en")

nlp = spacy.load('en_core_web_sm')

答案 5 :(得分:0)

我解决的问题如下。

问题:我发出了以下命令:

pip install spacy

python -m spacy 下载 en_core_web_lg

然后在python控制台中,当我使用spacy.load("en_core_web_lg")时,收到如下错误: “找不到模型‘en_core_web_lg’。它似乎不是快捷链接、Python 包或数据目录的有效路径。”

解决方案:

  1. 首先,发出“which python”命令来查找您的程序使用的python安装。 (输出示例:.../venv/bin/python)
  2. 在 lib 文件夹内(位于 'bin' 文件夹所在的同一级别),应该有一个 'site-packages/spacy' 文件夹。转到“spacy/data”文件夹。在“站点包”中,当您下载模型时,会创建一个文件夹(例如,en_core_web_lg 或 en_core_web_sm)。创建指向下载的模型文件夹的符号链接,如下所示: ln -s LOCATION_TO_MODEL THE_MODEL_NAME_YOU_WANT_TO_USE (例如:ln -s .../venv/lib/python3.5/site-packages/en_core_web_lg
    en_core_web_lg en_core_web_lg)
  3. 创建了一个名为“en_core_web_lg”的符号链接。
  4. spacy.load("en_core_web_lg") 命令现在可以工作了。作为参数传递的名称现在指向模型的正确位置

可以在此处找到有关符号链接的更多信息:https://askubuntu.com/questions/56339/how-to-create-a-soft-or-symbolic-link