从一组单词中生成所有可能的正确句子

时间:2020-06-02 11:46:54

标签: python nlp nltk generator

我有一组 276 个不同的词,我想从中生成所有可能的正确句子。它可以由两个或多个单词组成。

我使用了 NLTK 标记器为每个单词提供一个类。例如('And','CC'),('now','RB'),('for','IN'),('something','NN'),但是当单词彼此独立(在我的案例中为276个单词组成的数组)。

如果有人对我的想法有所了解,那将对我有很大帮助。谢谢!

2 个答案:

答案 0 :(得分:0)

您将需要一个语法来描述单词类别或单词的有效组合。例如:

S -> NP VP
NP -> det adj* noun
VP -> verb NP
VP -> verb NP conj NP

,依此类推。这是一个相当古老和简单的机制,但是应该足够容易实现。您只需生成规则的扩展,直到达到单词类类别,然后用相应的单词替换它们即可。当然,这是一个不同的问题,因为您的句子在语法上是正确的,但在语义上却很奇怪。

答案 1 :(得分:0)

您需要放置正确的语法规则以制作正确的必需句子。

有关更多信息,您可以通过以下链接:

https://www.nltk.org/book/ch08.html