Java:使用Wordnet和JWNL

时间:2016-01-24 07:26:14

标签: java wordnet

我正在使用JWNL检查单词并返回单词的词干(exp:know - > know)。它工作正常,但我如何保留一个单词中包含的句点(点)(exp:know。 - > know。),因为它会在每次用一个点干掉一个单词时删除句点。

String x = stem.StemWordWithWordNet ("knew.");
System.out.println(x);

词干的代码在这里:http://tipsandtricks.runicsoft.com/Other/JavaStemmer.html 或者,如果检测到一段时间,我是否可以将句点包含在词干中? 有人熟悉这个吗?感谢

1 个答案:

答案 0 :(得分:1)

单词词干只用于单词,所以要包括句子和时间等内容。你需要在外部完全停止。

这样做的一个简单方法是定义自己的词干提取方法来支持这些细节,它会在整个项目中重复使用时获得回报。

String stemWord(Stemmer s, String word) throws Exception
{
    return s.StemWordWithWordNet(word)
    + (word.charAt(word.length()-1)=='.'?".":"");
}

然后像这样使用它

String x = stemWord(stem,"knew.");
System.out.println(x);

String x = stemWord(stem,"knew");
System.out.println(x);