我正在JavaScript中实施Algorithm W(Hindley-Milner type system):
实现上述规则的函数是typecheck
,它具有以下签名:
typecheck :: (Context, Expr) -> Monotype
定义如下:
function typecheck(context, expression) {
switch (expression.type) {
case "Var":
var name = expression.name;
var type = context[name];
return inst(type);
case "App":
var fun = typecheck(context, expression.fun);
var dom = typecheck(context, expression.arg);
var cod = new Variable;
unify(fun, abs(dom, cod));
return cod;
case "Abs":
var param = expression.param;
var env = Object.create(context);
var dom = env[param] = new Variable;
var cod = typecheck(env, expression.result);
return abs(dom, cod);
case "Let":
var assignments = expression.assignments;
var env = Object.create(context);
for (var name in assignments) {
var value = assignments[name];
var type = typecheck(context, value);
env[name] = gen(context, type);
}
return typecheck(env, expression.result);
}
}
关于数据类型的一点点:
上下文是将标识符映射到多类型的对象。
type Context = Map String Polytype
表达式由以下代数数据类型定义:
data Expr = Var { name :: String }
| App { fun :: Expr, arg :: Expr }
| Abs { param :: String, result :: Expr }
| Let { assignments :: Map String Expr, result :: Expr }
| Rec { assignments :: Map String Expr, result :: Expr }
此外,我们还具有算法所需的以下功能,但对于该问题并不重要:
inst :: Polytype -> Monotype
abs :: (Monotype, Monotype) -> Monotype
gen :: (Context, Monotype) -> Polytype
inst
函数专用于多种类型,gen
函数概括了一种单型。
无论如何,我想扩展我的typecheck
功能以允许recursive definitions:
其中:
然而,我遇到了鸡和蛋的问题。第一个上下文具有假设v_1 : τ_1, ..., v_n : τ_n
。此外,它暗示e_1 : τ_1, ..., e_n : τ_n
。因此,您首先需要创建上下文以查找e_1, ..., e_n
的类型,但为了创建上下文,您需要找到e_1, ..., e_n
的类型。
你如何解决这个问题?我正在考虑将新的monotype变量分配给标识符v_1, ..., v_n
,然后将每个monotype变量与其各自的类型统一起来。这是OCaml用于其let rec
绑定的方法。但是,此方法不会产生最常见的类型,如以下OCaml代码所示:
$ ocaml
OCaml version 4.02.1
# let rec foo x = foo (bar true)
and bar x = x;;
val foo : bool -> 'a = <fun>
val bar : bool -> bool = <fun>
但是,GHC确实计算了最常见的类型:
$ ghci
GHCi, version 7.10.1: http://www.haskell.org/ghc/ :? for help
Prelude> let foo x = foo (bar True); bar x = x
Prelude> :t foo
foo :: Bool -> t
Prelude> :t bar
bar :: t -> t
如您所见,OCaml推断类型val bar : bool -> bool
,而GHC推断类型bar :: t -> t
。 Haskell如何推断函数bar
的最一般类型?
我从@ augustss&#39;中了解到。回答递归多态函数的类型推断是不可判定的。例如,如果没有其他类型注释,Haskell无法推断出以下size
函数的类型:
data Nested a = Epsilon | Cons a (Nested [a])
size Epsilon = 0
size (Cons _ xs) = 1 + size xs
如果我们指定类型签名size :: Nested a -> Int
,那么Haskell接受该程序。
但是,如果我们只允许代数数据类型的子集inductive types,那么数据定义Nested
将变为无效,因为它不是归纳的;如果我没有弄错,那么归纳多态函数的类型推断确实是可判定的。如果是这样,那么用于推断多态感应函数类型的算法是什么?
答案 0 :(得分:14)
您可以使用带有fix
类型的基元(a -> a) -> a
的显式递归来键入它。您可以手动或自动插入修复程序。
如果你想扩展类型推论,那么这也很容易。遇到递归函数f时,只需生成一个新的统一变量,并在环境中放置此类型的f。在对主体进行类型检查后,使用此变量统一主体类型,然后照常进行概括。我想这就是你的建议。它不会允许你推断多态递归,但这通常是不可判定的。