从文本

时间:2015-08-07 11:53:35

标签: stanford-nlp named-entity-extraction

我正在研究文本中的新实体发现,并想知道stanford nlp是否可用于此目的? 实际上我所知道的是,斯坦福需要训练有素的分类器来识别实体,但如果我没有错,它只会检测已知的实体,例如,如果你的模型包含“斯坦福是一个好大学”而斯坦福已经是一个知道的实体,如果我尝试“fooo是一所好大学”,它不会将其视为新实体

2 个答案:

答案 0 :(得分:1)

答案 1 :(得分:0)

好的 - 如果javascript适合您(node.js / browser),请参阅:http://github.com/redaktor/nlp_compromise/

这是一种“无训练”的解决方案。我在最后几天特别关注NER(命名实体提取) - 这里只是描述Named entity recognition with a small data set (corpus)

随便在github问题上问我这个问题,因为我没有记录新方法(没有时间,仍然正在研究