Question

我正在编写表达式解析器。我已经完成了词法和句法分析，现在我正在检查类型。我有一个像这样的数据结构表达式（简化版）：

data Expr = EBinaryOp String Expr Expr
          | EInt Int
          | EFloat Float

现在我需要一个将它转换为新类型的函数，比如说TypedExpr，它也包含类型信息。现在我的主要问题是，这种类型应该是什么样子。我有两个想法 - 使用类型参数：

data TypedExpr t = TEBinaryOp (TBinaryOp a b t) (TExpr a) (TExpr b)
                 | TEConstant t
addTypes :: (ExprType t) => Expr -> TypedExpr t

或没有：

data TypedExpr = TEBinaryOp Type BinaryOp TypedExpr TypedExpr
               | TEConstant Type Dynamic
addTypes :: Expr -> TypedExpr

我从第一个选项开始，但是我遇到了问题，因为这种方法假定你在解析之前知道表达式的类型（对我来说，在大多数情况下都是如此，但并非总是如此）。但是，我喜欢它，因为它允许我使用Haskell的类型系统并在编译时检查大多数错误。

是否可以使用第一个选项执行此操作？你会选哪一个？为什么呢？
每个选项应该有什么问题？

Answer 1

你的功能类型

addTypes :: Expr -> TypedExpr t

是错误的，因为这意味着您可以为任何TypedExpr t 获得t 。相反，你真正想要的是一个特定的 t，由Expr类型的参数决定。

这种推理已经表明你超越了Hindley-Milner型系统的能力。毕竟，addTypes的返回类型应该取决于参数的值，但在普通的Haskell 2010中，类型可能不依赖于值。因此，您需要类型系统的扩展，使您更接近依赖类型。在Haskell中，广义代数数据类型（GADT）可以做到这一点。

有关GADT的首次介绍，另请参阅my video on GADTs。

然而，在熟悉GADT之后，你仍然遇到将无类型表达式解析为类型化表达式的问题，即编写函数

addTypes :: Expr -> (exists t. TypedExpr t)

当然，你必须自己进行一些类型检查，但即使这样，也不容易说服Haskell编译器你的类型检查（发生在值级别上）可以提升到类型级别。幸运的是，其他人已经考虑过这个问题，请参阅haskell-cafe邮件列表中的以下消息：


Edward Kmett 。
    Re：手动类型检查以提供GADT的读取实例。         （是Re：[Haskell-cafe]阅读GATD的实例）
    http://article.gmane.org/gmane.comp.lang.haskell.cafe/76466

（有没有人知道正式出版/写得很好的参考文献？）

Answer 2

我最近开始使用tagless-final syntax用于嵌入式DSL，我发现它比标准的GADT方法更好（你正朝着这个方向发展，Apfelmus描述）。

无标记最终语法的关键是，您不使用表达式数据类型，而是使用类型类表示操作。对于像eBinaryOp这样的函数，我发现最好使用两个类：

class Repr repr where
  eInt :: repr Int
  eFloat :: repr Float

class Repr repr => BinaryOp repr a b c where
  eBinaryOp :: String -> repr a -> repr b -> repr c

我会制作单独的BinaryOp函数，而不是使用String。有关Oleg's web page的更多信息，包括使用Haskell类型系统的解析器。

Answer 3

由于你在运行时进行解析，而不是编译时，你不能躲开Haskell的类型系统（除非你导入相关的模块并自己手动调用它。）

您可能希望转向TAPL的类型检查器的ML示例，以获得灵感的简单lambda演算。 http://www.cis.upenn.edu/~bcpierce/tapl/（正在实施中）。它们比表达式解析器更多，因为你不支持lambdas。

如何创建一个引入新类型的Haskell函数？

3 个答案: