使用wordnet(或一些简单的字典)来检查名词是否可以从Java程序中计数或不可数

时间:2011-06-20 08:21:03

标签: java wordnet jaws-wordnet

我在Java中找到了2个库 - JWNL和JAWS。到目前为止,在我看来,这些API有助于查找同义词和下位词以及类似的东西。你知道是否有一些工具可以使用wordnet检查名词是否是可数/不可数名词?我的意思是,人们使用wordnet来完成这项任务吗?否则,该工具是什么?

2 个答案:

答案 0 :(得分:1)

如果找不到简单的来源,可以考虑建立自己的分类器,即。编写自己的用户定义函数。

要考虑的因素:

  • 有一些英语词典会将名词标记为(U)vs(C),因为无数可数和可数,你可能会在某处找到。
  • 您可以在巨大的语料库中查看双字母组合,以查看名词是否在可数或不可数的意义上使用: one boythis boythat boysome fooda little bit of food等。
  • 您需要考虑许多极端情况:I'd like some coffee vs I'd like a coffee(一杯咖啡的简称)。 它变得复杂了。

This SO question非常相关,但它不能解决您的Java请求。对这个问题的所有三个答案都非常好。

希望这有帮助。

答案 1 :(得分:0)

我不是100%肯定您的目标,但WolframAlphadeveloper interface您可以使用。

他们似乎也有java library,但免费版本似乎仅限于2k查询(不知道这是否是可行的限制)。