创建一个POSTagger模型

时间:2019-03-02 07:39:36

标签: android nlp

我正在尝试创建一个模型,该模型在离线的Android应用上采用输入句子,并向我返回该句子的词性。现在输入的语言将是印度语言,因此我正在尝试训练自己的工作模型。我已经有加标签的数据,可以使用我将要使用的语言进行培训。

我还遇到了Opennlp模型,这些模型在英语方面也做同样的工作。现在可以创建模型并将其与Opennlp库一起使用,这是一种自定义的Opennlp模型。我不确定这是否真的可能。

或者,我考虑过使用某种机器学习算法训练模型,然后使用它,但是我对如何使用该模型一无所知,因为我没有预定义的库,因为我没有所有可用命令与Opennlp在一起。

总而言之,我需要创建自己的模型以集成到Android应用中,该应用将检测输入语音的各个部分。该应用程序应以离线模式运行,但是,培训部分和其他预处理工作可以在线完成。

2 个答案:

答案 0 :(得分:0)

使用OpenNLP通过命令行工具或API用自己的数据训练模型非常简单。有关词性标记的信息,请参见:https://opennlp.apache.org/docs/1.5.3/manual/opennlp.html#tools.postagger.training

答案 1 :(得分:0)

要从头开始查找印度语句子的POS是一项艰巨的任务,首先,您必须创建一个带有正确注释的pos标签的庞大语料库,然后必须训练一个模型(该模型已经适用于英语)。 / p>

因此可行的方法是使用语言翻译API将句子翻译成英语并执行进一步的任务/分析。