我想识别用任何文字写的所有名字,目前我正在使用IMDB电影评论。
我正在使用stanford POS tagger,并分析所有专有名词(因为专有名词是人,事,地方的名字),但这很慢。
首先我正在标记所有输入行,然后我正在检查所有带有NNP的单词,这是一个缓慢的过程。
有没有有效的替代品来完成这项任务? ANy库(最好是JAVA)。 感谢。
答案 0 :(得分:1)
你知道输入语言吗?如果是,您可以将每个单词与字典匹配,并将该单词标记为专有名词(如果它不在字典中)。这需要一个完整的词典,包含语言中每个单词的所有变化,并注意数字和其他特殊情况。
编辑:另请参阅this answer in the official FAQ:您是否尝试更改使用的模型?
答案 1 :(得分:0)
名为GlobalNLP的(付费)网络服务可以使用多种语言进行:https://nlp.linguasys.com/docs/services/54131f001c78d802f0f2b28f/operations/5429f9591c78d80a3cd66926