应用错误收集

从文本

时间：2015-08-07 11:53:35

标签： stanford-nlp named-entity-extraction

我正在研究文本中的新实体发现，并想知道stanford nlp是否可用于此目的？实际上我所知道的是，斯坦福需要训练有素的分类器来识别实体，但如果我没有错，它只会检测已知的实体，例如，如果你的模型包含“斯坦福是一个好大学”而斯坦福已经是一个知道的实体，如果我尝试“fooo是一所好大学”，它不会将其视为新实体

2 个答案:

答案 0 :(得分：1)

您应对此项目感兴趣：

http://nlp.stanford.edu/software/patternslearning.shtml

答案 1 :(得分：0)

好的 - 如果javascript适合您（node.js / browser），请参阅：http://github.com/redaktor/nlp_compromise/

这是一种“无训练”的解决方案。我在最后几天特别关注NER（命名实体提取） - 这里只是描述Named entity recognition with a small data set (corpus)

随便在github问题上问我这个问题，因为我没有记录新方法（没有时间，仍然正在研究）