我想从输入文本数据中解析出所有人名。我已经使用Stanford Java NER library尝试了它,但它没有给出印度名称的准确答案。是否可以创建自定义分类器?或者是否有其他方法使用其他NLP技术以最大的准确度解析名称。
编辑:我将包含许多人名的随机文本作为输入提供给Stanford Named Entity Recognizer version 3.5.1的GUI应用程序但是它的准确性非常低。它不承认大多数名字。
答案 0 :(得分:0)
斯坦福NLP文档告诉您可以训练自己的NER模型。这是[FAQ] [1] [1]的链接:http://nlp.stanford.edu/software/crf-faq.shtml。 您可以使用带有人名的中等丰富文本,并在培训中使用它。
还有其他工具(例如,GATE)有一个人名列表,可以修改。
另外,浏览NLTK,LingPipe,FreeLing等其他流行的NLP库。