名词可数性

时间:2011-10-19 14:32:02

标签: nlp

有没有关于确定名词可数性的资源?有哪些方法可以解决它,或者是一个记录名词是否可数或不可数的字典?

我对这个名词是否可数是不可感知的,但更多的是它可能是可数的。例如,大米可以去碾米,这意味着它可以计数,但在大多数情况下它不会是。

4 个答案:

答案 0 :(得分:6)

这是一个艰难的。根据背景/意义,许多英语单词可以是(啤酒,时间,玻璃,语言等)。

从单词或常规词典中找出(un)可数性是不可能或不切实际的。

您可以通过查看单词的使用方式,尝试从大型文本语料库中找出它:

  • 如果有复数形式
  • 如果之前有无限期文章或没有
  • 如果它与很多/很少/很少/很少,一块(?)等一起使用

但是很多单词可以作为名词和形容词起作用,这使问题复杂化。例如,在an air pump中,air用作形容词,an用于pump,而不是air

同样,许多单词可以作为名词和动词使用,并且具有相同的形式。例如,在she pressures him中,pressures不是pressure的复数。

此外,一些不可数名词在它们被制作得更具特异性时,可以在它们之前有一个不定冠词。 knowledge vs a good practical knowledge

您可以从分析的语料库中收集统计数据,并根据它判断一个单词是否更可能是可数的或不可数的。

答案 1 :(得分:2)

现有几种英语词汇包含有关计数/质量/等的信息。区别,其中没有一个彼此非常一致,因为他们专注于略有不同的区别,这是一项复杂的任务。两个是ComLex和CUVPlus(目前我找不到下载链接,虽然你可以在很多地方找到它)。

查看Timothy Baldwin and Francis Bond in 2003关于从语料库学习名词可数性的工作。如果你在语料库中出现了很多不熟悉的名词,你可以很好地确定这个名词是否可能是一个计数名词,可能是一个大众名词,等等。但个别实例仍然是相当的难以分类。如果你有句子“wug是白色的”并且根据你的词典“wug”可以是计数或质量,那么在紧急情况下没有足够的信息来帮助你对它进行分类。

答案 2 :(得分:1)

我不确定是否有一份“官方”词典,说明一个名词是否可能是可数的,但我可以提出两种方法来解决这个问题:

  • 要么假设一个名词可能是不可数的,如果有人把它放在“大量名词列表”或“不可数名词列表”中(如果你谷歌搜索这些短语,你会发现很多,例如this)。

  • 或者做一个小语料库研究,看看这个单词的使用频率是多少:在Corpus of contemporary american English中搜索“rice”给了我们22265次点击,而“rices”这个词只找到了69个次。

答案 3 :(得分:0)

这取决于上下文以及名词本身是否具有复数。同一个词的不同含义可能不同,例如:

  • 期望:感觉与预期的结合
  • 盐:食盐与一种化学元素

我们的API,GlobalNLP,在此方法中返回特定上下文中名词(以及其他内容)的可计数性:https://nlp.linguasys.com/docs/services/53fccbb15cfea30d9c48f8d6/operations/542a6da01c78d80a3cd6692a