意大利语的命名实体识别

时间:2012-10-22 11:46:45

标签: nlp stanford-nlp opennlp

我想使用NLP工具从意大利语文本中提取姓名和数字。

可悲的是,The Standford NLPApache OpenNLP都没有提供意大利语的模型。

我可以找到一个,或者找一个培训数据吗? (至少15,000句话)

1 个答案:

答案 0 :(得分:4)

Italian Content Annotation Bank有一些NER注释数据。但不确定尺寸。至于数字,我认为一个简单的基于规则的方法可以解决问题。