我尝试根据https://www.clips.uantwerpen.be/pages/using-wikicorpus-nltk-to-build-a-spanish-part-of-speech-tagger中提供的示例训练语料库但是,此示例使用NLTK 2进行BillTraining培训以及以下导入和使用:
from nltk.tag.brill import SymmetricProximateTokensTemplate
from nltk.tag.brill import ProximateTokensTemplate
from nltk.tag.brill import ProximateTagsRule
from nltk.tag.brill import ProximateWordsRule
ctx = [ # Context = surrounding words and tags.
SymmetricProximateTokensTemplate(ProximateTagsRule, (1, 1)),
SymmetricProximateTokensTemplate(ProximateTagsRule, (1, 2)),
SymmetricProximateTokensTemplate(ProximateTagsRule, (1, 3)),
SymmetricProximateTokensTemplate(ProximateTagsRule, (2, 2)),
SymmetricProximateTokensTemplate(ProximateWordsRule, (0, 0)),
SymmetricProximateTokensTemplate(ProximateWordsRule, (1, 1)),
SymmetricProximateTokensTemplate(ProximateWordsRule, (1, 2)),
ProximateTokensTemplate(ProximateTagsRule, (-1, -1), (1, 1)),
]
我希望在http://www.nltk.org/_modules/nltk/tag/brill_trainer.html中专门针对(SymmetricProximateTokensTemplate,ProximateWordsRule,ProximateTagsRule)在NLTK 3.5中找到这些等价物,但在环顾一段时间之后我还没有找到任何等价物。你们有没有遇到同样的问题?我对图书馆的了解仍处于开发阶段(新手在这里),所以任何帮助都将受到高度赞赏。
干杯