我正在尝试提取nltk.corpus.brown.tagged_words()
的具有特定标签的子集,例如VBZ
。
文档对我来说似乎很混乱,在这方面没有帮助。我知道我可以通过for循环或列表理解来做到这一点,但是我想知道tagged_words()
中是否有某种内置功能可以过滤具有特定标记的元组。 >
谢谢。
演示:
>>> from nltk.corpus import brown
>>> brown.tagged_words()
[(u'The', u'AT'), (u'Fulton', u'NP-TL'), ...]