我正在研究文本中的新实体发现,并想知道stanford nlp是否可用于此目的? 实际上我所知道的是,斯坦福需要训练有素的分类器来识别实体,但如果我没有错,它只会检测已知的实体,例如,如果你的模型包含“斯坦福是一个好大学”而斯坦福已经是一个知道的实体,如果我尝试“fooo是一所好大学”,它不会将其视为新实体
答案 0 :(得分:1)
答案 1 :(得分:0)
好的 - 如果javascript适合您(node.js / browser),请参阅:http://github.com/redaktor/nlp_compromise/
这是一种“无训练”的解决方案。我在最后几天特别关注NER(命名实体提取) - 这里只是描述Named entity recognition with a small data set (corpus)
随便在github问题上问我这个问题,因为我没有记录新方法(没有时间,仍然正在研究)