常规的haskell代数数据类型是否等同于上下文无关语法? GADTS怎么样?

时间:2014-11-17 00:53:30

标签: haskell programming-languages formal-languages

代数数据类型的语法与Backus–Naur Form的语法非常相似,后者用于描述无上下文语法。这让我想到,如果我们将Haskell类型检查器看作语言的解析器,表示为代数数据类型(例如,表示终端符号的nularry类型构造函数),则接受的所有语言的集合与一组上下文免费语言?另外,通过这种解释,GADT可以接受哪些正式语言?

1 个答案:

答案 0 :(得分:11)

首先,数据类型并不总是描述一组字符串(即语言)。也就是说,虽然列表类型的确如此,但树型不会。有人可能反驳说,我们可以将树木“压扁”成列表,并将其视为他们的语言。然而,像

这样的数据类型呢?
data F = F Int (Int -> Int)

或更糟糕

data R = R (R -> Int)

多项式类型(内部没有->的类型)大致描述了可以展平的树(按顺序访问),所以我们以这些为例。

正如您所观察到的,将CFG写为(多项式)类型很容易,因为您可以利用递归

data A = A1 Int A | A2 Int B
data B = B1 Int B Char | B2
上面A

表示{ Int^m Char^n | m>n }

GADT远远超出了无语境的语言。

data Z
data S n 

data ListN a n where
  L1 :: ListN a Z
  L2 :: a -> ListN a n -> ListN a (S n)

data A
data B
data C

data ABC where
   ABC :: ListN A n -> ListN B n -> ListN C n -> ABC
上面ABC

表示(扁平化)语言A^n B^n C^n,它不是无上下文的。

你几乎不受GADT限制,因为用它们编码算术很容易。 也就是说,您可以使用Peano构建一个非空{if} Plus a b c的{​​{1}}类型 土黄。如果图灵机c=a+b,您还可以构建一个非空的类型Halt n m 输入m暂停。所以,你可以建立一种语言

m

是递归的(大概不是在任何更简单的类中)。

目前,我不知道您是否可以在GADT中描述递归可枚举(可计算可枚举)的语言。即使在停止问题的例子中,我也必须包括“证明”一词 在GADT里面让它发挥作用。

直观地说,如果你有一个长度为{ A^n B^m proof | n halts on m , and proof proves it } 的字符串,并且想要针对GADT检查它,你可以 构建所有GADT深度n项,展平它们,然后与字符串进行比较。这应该 证明这种语言总是递归的。但是,存在类型使这棵树成为可能 方法相当棘手,所以我现在没有明确的答案。