不定式消歧

时间:2014-06-10 18:25:16

标签: nlp

如何判断一个单词是否为不定式? 例如,这里"修复"是不定式的:

Fixing the door was also easy but fixing the window was very hard.

但是在

I am fixing the door

不是。人们如何消除这些案件的歧义?

2 个答案:

答案 0 :(得分:1)

详细说明我的评论:

在PoS标记中,在动名词(VBG)和名词(NN)之间进行选择是非常微妙的,并且有许多特殊情况。我的理解是fixing应该在第一句中被标记为动名词,因为它可以在该上下文中被副词修改。引自Penn PoS tagging guidelines(第19页):

"While both nouns and gerunds can be preceded by an article or a possessive pronoun, only a noun (NN) can be modified by an adjective, and only a gerund (VBG) can be modified by an adverb."

示例:

    Good/JJ cooking/NN is something to enjoy. 
    Cooking/VBG well/RB is a useful skill.

答案 1 :(得分:0)

假设您的意思是“自动消除歧义”,此任务需要进行一些处理(pos-tagging和语法分析)。我们的想法是找到一个动词的实例,这些动词之前没有一个同意的主题名词短语。如果您还想捕捉“修复”等不定式表单,只需将其添加到您要查找的表单列表中。