应用错误收集

我可以访问用于训练斯坦福NER中国模型的原始语料库

时间：2016-01-28 15:17:10

标签： stanford-nlp

我正在尝试重新培训斯坦福名称实体识别器的中国模型。我想知道是否有办法获得原始的中文语料库来培训官方模型？ stanford-nlp网页说他们使用了CoNLL，MUC-6，MUC-7和ACE的语料库。我检查了CoNLL2003似乎没有中文语料库，我需要支付MUC-6，MUC-7和ACE。还有其他方法可以获得这些吗？谢谢。

1 个答案:

答案 0 :(得分：1)

网页信息适用于英语而非中文。对于中国人，我相信它正在使用OntoNotes语料库 - 或许可以查看相应的研究论文。无论如何，我们不能分发这些语料库，你必须从LDC获得它们。

我可以访问用于训练斯坦福NER中国模型的原始语料库
训练斯坦福定制的NER模型
使用自定义语料库训练NLTK中的NER模型
如何训练我自己的中国NER模型
训练NER模型以避免内存错误
如何用Standford库训练我自己的NER模型？
在Stanford NLP中训练NER模型
训练NER模型以识别自定义实体
在阿拉伯语料库上训练Stanford NER模型
使用自定义IOB语料库（使用NLTK，train_chunerk.py）训练NER模型

我写了这段代码，但我无法理解我的错误
我无法从一个代码实例的列表中删除 None 值，但我可以在另一个实例中。为什么它适用于一个细分市场而不适用于另一个细分市场？
是否有可能使 loadstring 不可能等于打印？卢阿
java中的random.expovariate()
Appscript 通过会议在 Google 日历中发送电子邮件和创建活动
为什么我的 Onclick 箭头功能在 React 中不起作用？
在此代码中是否有使用“this”的替代方法？
在 SQL Server 和 PostgreSQL 上查询，我如何从第一个表获得第二个表的可视化
每千个数字得到
更新了城市边界 KML 文件的来源？