NLTK中的Stanford CoreNLP无壳分类器

时间:2016-12-13 09:31:04

标签: python-2.7 nltk stanford-nlp

我无法从http://nlp.stanford.edu/software/stanford-ner-2015-04-20.zip下载的zip文件中找到文件english.conll.4class.caseless.distsim.crf.ser.gz。任何人都可以告诉我如何获得无用的分类文件来自Stanford CoreNLP?

2 个答案:

答案 0 :(得分:0)

我不认为他们正在提供直接的gz文件,因为无格式但是通过makefile脚本派生,我检查了linux版本以及它也没有在那里,并且不知何故他们正在通过truecaser构建它似乎虽然我不完全理解机制,但下面是一个指针,我在stanford核心nlp git hub中看到了引用。

https://github.com/stanfordnlp/CoreNLP/blob/d558d95d80b36b5b45bc21882cbc0ef7452eda24/scripts/ner/Makefile

您可以搜索" english.conll.4class.caseless.distsim.crf.ser.gz"在corenlp github中有更多关于它的指示。

仅供参考。你也可以查看旧版本,就像他们单独提供给他们的文档中提到的那样。

答案 1 :(得分:0)

对于那些面临相同问题的人;

https://stanfordnlp.github.io/CoreNLP/index.html#download下载模型jar(有一个表列出了不同语言的不同模型)并打开/提取jar内容(例如,我使用WinRar),然后转到 edu / stanford / nlp / models / ner 目录中,您可以找到任何模型的 ser.gz 文件。