如何使用算法W键入检查递归定义?

时间:2015-04-22 18:34:52

标签: javascript haskell ocaml type-inference coq

我正在JavaScript中实施Algorithm WHindley-Milner type system):

Algorithm W

实现上述规则的函数是typecheck,它具有以下签名:

typecheck :: (Context, Expr) -> Monotype

定义如下:

function typecheck(context, expression) {
    switch (expression.type) {
    case "Var":
        var name = expression.name;
        var type = context[name];
        return inst(type);
    case "App":
        var fun = typecheck(context, expression.fun);
        var dom = typecheck(context, expression.arg);
        var cod = new Variable;
        unify(fun, abs(dom, cod));
        return cod;
    case "Abs":
        var param = expression.param;
        var env   = Object.create(context);
        var dom   = env[param] = new Variable;
        var cod   = typecheck(env, expression.result);
        return abs(dom, cod);
    case "Let":
        var assignments = expression.assignments;
        var env = Object.create(context);

        for (var name in assignments) {
            var value = assignments[name];
            var type  = typecheck(context, value);
            env[name] = gen(context, type);
        }

        return typecheck(env, expression.result);
    }
}

关于数据类型的一点点:

  1. 上下文是将标识符映射到多类型的对象。

    type Context = Map String Polytype
    
  2. 表达式由以下代数数据类型定义:

    data Expr = Var { name        :: String                          }
              | App { fun         :: Expr,            arg    :: Expr }
              | Abs { param       :: String,          result :: Expr }
              | Let { assignments :: Map String Expr, result :: Expr }
              | Rec { assignments :: Map String Expr, result :: Expr }
    
  3. 此外,我们还具有算法所需的以下功能,但对于该问题并不重要:

    inst ::  Polytype -> Monotype
    abs  :: (Monotype,   Monotype) -> Monotype
    gen  :: (Context,    Monotype) -> Polytype
    

    inst函数专用于多种类型,gen函数概括了一种单型。

    无论如何,我想扩展我的typecheck功能以允许recursive definitions

    Recursive definitions

    其中:

    1. Recursive definition context one
    2. Recursive definition context two
    3. 然而,我遇到了鸡和蛋的问题。第一个上下文具有假设v_1 : τ_1, ..., v_n : τ_n。此外,它暗示e_1 : τ_1, ..., e_n : τ_n。因此,您首先需要创建上下文以查找e_1, ..., e_n的类型,但为了创建上下文,您需要找到e_1, ..., e_n的类型。

      你如何解决这个问题?我正在考虑将新的monotype变量分配给标识符v_1, ..., v_n,然后将每个monotype变量与其各自的类型统一起来。这是OCaml用于其let rec绑定的方法。但是,此方法不会产生最常见的类型,如以下OCaml代码所示:

      $ ocaml
              OCaml version 4.02.1
      
      # let rec foo x = foo (bar true)     
        and bar x = x;;
      val foo : bool -> 'a = <fun>
      val bar : bool -> bool = <fun>
      

      但是,GHC确实计算了最常见的类型:

      $ ghci
      GHCi, version 7.10.1: http://www.haskell.org/ghc/  :? for help
      Prelude> let foo x = foo (bar True); bar x = x
      Prelude> :t foo
      foo :: Bool -> t
      Prelude> :t bar
      bar :: t -> t
      

      如您所见,OCaml推断类型val bar : bool -> bool,而GHC推断类型bar :: t -> t。 Haskell如何推断函数bar的最一般类型?

      我从@ augustss&#39;中了解到。回答递归多态函数的类型推断是不可判定的。例如,如果没有其他类型注释,Haskell无法推断出以下size函数的类型:

      data Nested a = Epsilon | Cons a (Nested [a])
      
      size Epsilon     = 0
      size (Cons _ xs) = 1 + size xs
      

      如果我们指定类型签名size :: Nested a -> Int,那么Haskell接受该程序。

      但是,如果我们只允许代数数据类型的子集inductive types,那么数据定义Nested将变为无效,因为它不是归纳的;如果我没有弄错,那么归纳多态函数的类型推断确实是可判定的。如果是这样,那么用于推断多态感应函数类型的算法是什么?

1 个答案:

答案 0 :(得分:14)

您可以使用带有fix类型的基元(a -> a) -> a的显式递归来键入它。您可以手动或自动插入修复程序。

如果你想扩展类型推论,那么这也很容易。遇到递归函数f时,只需生成一个新的统一变量,并在环境中放置此类型的f。在对主体进行类型检查后,使用此变量统一主体类型,然后照常进行概括。我想这就是你的建议。它不会允许你推断多态递归,但这通常是不可判定的。