我有一组 276 个不同的词,我想从中生成所有可能的正确句子。它可以由两个或多个单词组成。
我使用了 NLTK 标记器为每个单词提供一个类。例如('And','CC'),('now','RB'),('for','IN'),('something','NN'),但是当单词彼此独立(在我的案例中为276个单词组成的数组)。
如果有人对我的想法有所了解,那将对我有很大帮助。谢谢!
答案 0 :(得分:0)
您将需要一个语法来描述单词类别或单词的有效组合。例如:
S -> NP VP
NP -> det adj* noun
VP -> verb NP
VP -> verb NP conj NP
,依此类推。这是一个相当古老和简单的机制,但是应该足够容易实现。您只需生成规则的扩展,直到达到单词类类别,然后用相应的单词替换它们即可。当然,这是一个不同的问题,因为您的句子在语法上是正确的,但在语义上却很奇怪。
答案 1 :(得分:0)