识别给定文本中的所有名称

时间:2014-04-06 16:42:54

标签: java nlp stanford-nlp linguistics lingpipe

我想识别用任何文字写的所有名字,目前我正在使用IMDB电影评论。

我正在使用stanford POS tagger,并分析所有专有名词(因为专有名词是人,事,地方的名字),但这很慢。

首先我正在标记所有输入行,然后我正在检查所有带有NNP的单词,这是一个缓慢的过程。

有没有有效的替代品来完成这项任务? ANy库(最好是JAVA)。 感谢。

2 个答案:

答案 0 :(得分:1)

你知道输入语言吗?如果是,您可以将每个单词与字典匹配,并将该单词标记为专有名词(如果它不在字典中)。这需要一个完整的词典,包含语言中每个单词的所有变化,并注意数字和其他特殊情况。

编辑:另请参阅this answer in the official FAQ:您是否尝试更改使用的模型?

答案 1 :(得分:0)

名为GlobalNLP的(付费)网络服务可以使用多种语言进行:https://nlp.linguasys.com/docs/services/54131f001c78d802f0f2b28f/operations/5429f9591c78d80a3cd66926