NLP:使用lemmaGen c ++进行词形还原

时间:2013-01-28 19:20:05

标签: c++ nlp lemmatization

我正在增强聊天机器人,我希望找到输入句子中的单词的引理。聊天机器人是用c ++编写的,我找到了一个名为LemmaGen的免费开源词典化工具。我已经下载了2.2版的c ++版本,但它没有关于如何引用甚至使用它的文档。

过去有没有人有过使用LemmaGen for c ++的经验?任何信息都会有所帮助。 非常感谢

1 个答案:

答案 0 :(得分:2)

我没有使用c ++版本,但我确实使用过C#版本。 LemmaGen用于C#非常简单直接。首先用模型文件的参数初始化Lemmatizer类型的对象然后你可以将它的公共方法称为Lemmatize字,表示为字符串。因此,您所要做的就是对文本进行标记,然后将每个标记逐个变为lematize。方法返回表示输入词的引理的字符串。

我想使用C ++版本是类似的。