应用错误收集

使用NER从大文本中解析人名

时间：2015-02-25 09:36:16

标签： java nlp named-entity-recognition

我想从输入文本数据中解析出所有人名。我已经使用Stanford Java NER library尝试了它，但它没有给出印度名称的准确答案。是否可以创建自定义分类器？或者是否有其他方法使用其他NLP技术以最大的准确度解析名称。

编辑：我将包含许多人名的随机文本作为输入提供给Stanford Named Entity Recognizer version 3.5.1的GUI应用程序但是它的准确性非常低。它不承认大多数名字。

1 个答案:

答案 0 :(得分：0)

斯坦福NLP文档告诉您可以训练自己的NER模型。这是[FAQ] [1] [1]的链接：http://nlp.stanford.edu/software/crf-faq.shtml。您可以使用带有人名的中等丰富文本，并在培训中使用它。

还有其他工具（例如，GATE）有一个人名列表，可以修改。

另外，浏览NLTK，LingPipe，FreeLing等其他流行的NLP库。