如何使用POS标记语料库(Python)递归构建CFG?

时间:2018-11-25 16:02:42

标签: python nlp context-free-grammar context-sensitive-grammar

我见过很多有关从手动生成的基于规则的语法生成随机句子的文章,但是我从未见过任何关于如何使用POS标记的句子集生成自己的(宽松的)CFG的见解。 我的目的是解析该语料库,并创建词典字典,以显示语料库中存在的所有可能的标签序列。我什至不知道这是否有可能,但是我希望从别人那里得到一些建议或知识。 我正在尝试递归实现,目前字典的深度为3个单词,但除此以外,我什么都做不到。

0 个答案:

没有答案