如何根据两个表达式是否引用相同的绑定名称来创建重写传递?

时间:2012-09-03 23:37:06

标签: haskell compiler-construction

如何查找和重写引用相同绑定名称的表达式?例如,在表达式

let xs = ...
in ...map f xs...map g xs...

表达式map f xs和表达式map g xs都引用相同的绑定名称,即xs。是否有任何标准的编译器分析可以让我们识别这种情况并将两个map表达式重写为例如。

let xs = ...
    e = unzip (map (f *** g) xs)
in ...fst e...snd e...

我一直在考虑树遍历的问题。例如,鉴于AST:

data Ast = Map (a -> b) -> Ast -> Ast
         | Var String
         | ...

我们可以尝试编写树遍历来检测这种情况,但这似乎很难,因为引用相同Map的两个Var节点可能出现在树中广泛不同的位置。如果你反转AST中的所有引用,使其成为图形,这种分析似乎更容易做,但我想看看是否有任何替代方法。

1 个答案:

答案 0 :(得分:2)

我认为您正在寻找的是一组程序转换,通常称为Tupling,Fusion和Supercompilation,它们属于更广泛的展开/折叠转换理论。你可以按照以下方式实现你想要的目标。

首先通过在参数上“驱动”map的定义来执行推测评估(Unfolding),这会产生两个新的伪程序,具体取决于xs是否为y:ys或[]形式。在伪代码中:

let y:ys = ...
in ...(f y):(map f ys)...(g y):(map g ys)...

let [] = ...
in ...[]...[]...

然后对原始程序执行共享结构(Tupling)和泛化(Folding)的抽象,以阻止其他永久展开:

let xs = ...
in ...(fst tuple)...(snd tuple)...
where tuple = generalisation xs
      generalisation [] = ([],[])
      generalisation (y:ys) = let tuple = generalisation ys
                              in ((f y):(fst tuple),(g y):(snd tuple))

我希望这给你一个想法,但程序转换本身就是一个研究领域,如果不绘制非循环有向图,很难很好地解释。