为什么行ける解析成一个令牌,但见られる解析为2(见+られる)?

时间:2017-07-28 03:48:47

标签: mecab

两者都代表不同类型动词的相同形式 - 它们是否应该解析为单个标记?即使2个令牌更有意义,它们应该是一致的,并且我会想到解析为2。

编辑:在评论中指出,见られる也可能是被动的 - 另一个例子是食べれる,它也被标记为2个令牌(食べ+れる),但肯定是潜在的。

1 个答案:

答案 0 :(得分:2)

简短的回答:因为行ける/见える在字典中并且见られる不是。 (注意:ipadic和unidic都是这种情况。)

在行ける和见られる的情况下,区别非常简单 - 行く是五段/five-step verb而见る不是。在Unidic和IPAdic中,由于动词结尾的处理方式,注册了五步动词。动词结尾基本上都是助动词(像られる这样可识别的单位,不能单独存在)或补助动词(しまう等可以独立存在的东西),但字典形式的结尾如る或う不被视为其中任何一个,所以他们不要获得自己的词性标记,并使用动词根形成一个标记。

对于见える,情况有点棘手 - 见える被视为根本动词,而不仅仅是见る的潜在形式。如果你看一下Unidic的lex.csv,你会看到一堆见える的变形,其中见える作为基本形式。看看词典,见える有自己的条目似乎很常见,部分是出于历史原因(查看まみえる)。

有关如何以及为何将动词分解为多个标记的更长解释,请查找短单位字,中单位字,长单位字和Bunsetsu的详细信息。文档from NINJAL涵盖了概念,但对动词的细节很少; Comainu是一个可以检测所有这些类的系统; this lengthy article提供了对英语历史的很好的概述。

希望有所帮助!