我正在编写表达式解析器。我已经完成了词法和句法分析,现在我正在检查类型。我有一个像这样的数据结构表达式(简化版):
data Expr = EBinaryOp String Expr Expr
| EInt Int
| EFloat Float
现在我需要一个将它转换为新类型的函数,比如说TypedExpr
,它也包含类型信息。现在我的主要问题是,这种类型应该是什么样子。我有两个想法 - 使用类型参数:
data TypedExpr t = TEBinaryOp (TBinaryOp a b t) (TExpr a) (TExpr b)
| TEConstant t
addTypes :: (ExprType t) => Expr -> TypedExpr t
或没有:
data TypedExpr = TEBinaryOp Type BinaryOp TypedExpr TypedExpr
| TEConstant Type Dynamic
addTypes :: Expr -> TypedExpr
我从第一个选项开始,但是我遇到了问题,因为这种方法假定你在解析之前知道表达式的类型(对我来说,在大多数情况下都是如此,但并非总是如此)。但是,我喜欢它,因为它允许我使用Haskell的类型系统并在编译时检查大多数错误。
是否可以使用第一个选项执行此操作?
你会选哪一个?为什么呢?
每个选项应该有什么问题?
答案 0 :(得分:10)
你的功能类型
addTypes :: Expr -> TypedExpr t
是错误的,因为这意味着您可以为任何TypedExpr t
获得t
。相反,你真正想要的是一个特定的 t
,由Expr
类型的参数决定。
这种推理已经表明你超越了Hindley-Milner型系统的能力。毕竟,addTypes
的返回类型应该取决于参数的值,但在普通的Haskell 2010中,类型可能不依赖于值。因此,您需要类型系统的扩展,使您更接近依赖类型。在Haskell中,广义代数数据类型(GADT)可以做到这一点。
有关GADT的首次介绍,另请参阅my video on GADTs。
然而,在熟悉GADT之后,你仍然遇到将无类型表达式解析为类型化表达式的问题,即编写函数
addTypes :: Expr -> (exists t. TypedExpr t)
当然,你必须自己进行一些类型检查,但即使这样,也不容易说服Haskell编译器你的类型检查(发生在值级别上)可以提升到类型级别。幸运的是,其他人已经考虑过这个问题,请参阅haskell-cafe邮件列表中的以下消息:
Edward Kmett 。
Re:手动类型检查以提供GADT的读取实例。 (是Re:[Haskell-cafe]阅读GATD的实例)
http://article.gmane.org/gmane.comp.lang.haskell.cafe/76466
(有没有人知道正式出版/写得很好的参考文献?)
答案 1 :(得分:4)
我最近开始使用tagless-final syntax用于嵌入式DSL,我发现它比标准的GADT方法更好(你正朝着这个方向发展,Apfelmus描述)。
无标记最终语法的关键是,您不使用表达式数据类型,而是使用类型类表示操作。对于像eBinaryOp
这样的函数,我发现最好使用两个类:
class Repr repr where
eInt :: repr Int
eFloat :: repr Float
class Repr repr => BinaryOp repr a b c where
eBinaryOp :: String -> repr a -> repr b -> repr c
我会制作单独的BinaryOp函数,而不是使用String。 有关Oleg's web page的更多信息,包括使用Haskell类型系统的解析器。
答案 2 :(得分:3)
由于你在运行时进行解析,而不是编译时,你不能躲开Haskell的类型系统(除非你导入相关的模块并自己手动调用它。)
您可能希望转向TAPL的类型检查器的ML示例,以获得灵感的简单lambda演算。 http://www.cis.upenn.edu/~bcpierce/tapl/(正在实施中)。它们比表达式解析器更多,因为你不支持lambdas。