Question

我正在寻找一种方法，在过去，现在和将来的时间里都有一个英文文本计数动词短语。现在我正在使用NLTK，做一个POS（词性）标记，然后计算说'VBD'来过去时态。这虽然不够准确，所以我想我需要进一步使用分块，然后分析VP块以获取特定的时态模式。有什么存在的吗？任何进一步的阅读可能会有所帮助？ NLTK book主要关注NP-chunk，我可以找到关于VP-chunk的很少信息。

Answer 1

你的确切答案取决于你打算使用哪个chunker，但是列表推导会带你走很长的路。这可以使用不存在的块来获取动词短语的数量。

len([phrase for phrase in nltk.Chunker(sentence) if phrase[1] == 'VP'])

您可以采用更精细的方法来检测时态数量。

Answer 2

您可以使用Berkeley Parser或Stanford Parser执行此操作。但我不知道是否有可用的Python接口。

使用NLTK检测英语动词时态

2 个答案: