在Haskell中使用Data.Map进行动态编程?

时间:2012-04-10 05:51:50

标签: haskell dynamic-programming collatz

我正在尝试在Haskell中实现一个简单的dp算法(这是来自Project Euler的Collat​​z猜想问题);这是等效的c ++:

map<int,int> a;
int solve(int x) {
  if (a.find(x) != a.end()) return a[x];
  return a[x] = 1 + /* recursive call */;
}

所以我在Haskell中编写的代码最终看起来像这样:

solve :: (Memo, Int) -> (Memo, Int)
solve (mem, x) =
 case Map.lookup x mem of
  Just l -> (mem, l)
  Nothing -> let (mem', l') = {- recursive call -}
                 mem'' = Map.insert x (1+l') mem'
             in (mem'', 1+l')

(我认为我只是在这里重新实现状态monad,但暂时不介意。)调用solve的代码尝试找到它最多可以为参数赋予的最大值K = 1e6:< / p>

foldl'
 (\(mem,ss) k ->
   let (mem',x') = solve (mem, k)
   in (mem', (x', k):ss))
 (Map.singleton 1 1, [(1,1)]) [2..100000]

上面写的代码因堆栈溢出而失败。我理解这是可以预期的,因为它构建了一个非常大的未评估的thunk。所以我尝试使用

x' `seq` (mem', (x',k):ss)

在foldl'里面,它计算出K = 1e5的正确答案。但这对K = 1e6失败(堆栈在12秒内溢出)。然后我尝试使用

mem'' `seq` l' `seq` (mem'', 1+l')

在求解的最后一行,但这没有区别(堆栈溢出仍然存在)。然后我尝试使用

mem'' `deepseq` l' `seq` (mem'', 1+l')

这非常慢,大概是因为deepseq遍历整个地图mem'',使得算法的时间复杂度呈二次方而不是n * log(n)。

实现这个的正确方法是什么?我被困了,因为我无法弄清楚如何使整个计算严格,我不太确定计算的哪一部分给堆栈溢出,但我怀疑它是地图。我可以使用例如数组,但我想知道我在这里做错了什么。

1 个答案:

答案 0 :(得分:6)

使用32位有符号整数类型时,堆栈溢出不会消失。对于某些起始值,链离开32位范围并进入负数的无限循环。使用IntegerInt64Word64