当我运行以下代码时,我得到名词“Suppression”的引理是同一个词“Suppression”。
import treetaggerwrapper as tt
tt_fr = tt.TreeTagger(TAGLANG='fr')
tag = tt_fr.TagText(u'Suppression')
我等待的结果是获得“Supprimer”的实际动词。是因为语言(法语)?或者Treetagger不做这项工作?还是我不理解引理的含义?
答案 0 :(得分:0)
名词“抑制”的引理是...“抑制”。您需要的是词汇资源,告诉您名词所源自的动词。看一下VerbAction,其中列出了动词及其相关的副词名词。 只需将XML解析为Python字典,然后为遇到的每个名词查找相应的动词即可。