是否已发表自然语言的生成语法?

时间:2011-07-05 13:08:59

标签: nlp

我对自然语言处理有一些想法。我需要一些

的语法
S -> NP VP

多样性以便与他们一起玩。

如果我自己尝试编写这些规则,那将是一项繁琐且容易出错的业务。 有没有人为英语和其他自然语言输入并发布了全面的规则集?理想情况下用BNF,Prolog或类似语法编写。

我的项目只涉及无上下文的语法,我对统计方法或机器学习不感兴趣 - 我需要系统地生成类似Engligh和Foobarian的句子。

如果你知道在哪里找到这样的物资,我会非常感激。

3 个答案:

答案 0 :(得分:5)

您可能希望查看Attempto Controlled English及其基于Prolog的工具。

由于统计解析在90年代早期流行,语法通常不会被分发,除了特定的问题域,而是派生自分布式语料库,如宾夕法尼亚大学银行。如果你能掌握它(我相信一个样本是用NLTK分发的),你可以通过查看所有树片段并将它们翻译成规则来“滚动你自己的”语法。 (例如,如果您发现标有 S 的节点,其子项标有 NP VP ,您知道应该有一个规则 S < / em> - &gt; NP VP 。修剪不经常发生的规则是一个好主意。)

答案 1 :(得分:3)

我所知道的最全面的无语境语法是:

Gazdar,Gerald; Ewan H. Klein,Geoffrey K. Pullum,Ivan A. Sag。 1985. 广义短语结构语法。牛津:布莱克威尔。

在线免费提供一些基于规则但非上下文无关的语法,例如Penn XTAG grammar或HPSG English Resource Grammar

答案 2 :(得分:1)

查看Grammatical Framework。它是一种多语言语法应用程序的函数式编程语言,包含大约30种语言的库,其中包括英语。