使用recur,lazy seq的Clojure堆栈溢出?

时间:2011-04-15 20:58:56

标签: clojure overflow lazy-evaluation

我已经阅读了其他人关于在Clojure中出现堆栈溢出问题的问题,而问题往往是在某个地方构建一个懒惰的序列。这似乎是这里的问题,但对于我的生活,我无法弄清楚在哪里。

这是代码,代码之后是一些解释:

(defn pare-all []
  "writes to disk, return new counts map"
(loop [counts (counted-origlabels)
     songindex 0]
(let [[o g] (orig-gen-pair songindex)]
  (if (< songindex *song-count*) ;if we are not done processing list
    (if-not (seq o) ;if there are no original labels
      (do
        (write-newlabels songindex g);then use the generated ones
        (recur counts (inc songindex)))
      (let [{labels :labels new-counts :countmap} (pare-keywords o g counts)] ;else pare the pairs
        (write-newlabels songindex labels)
        (recur new-counts (inc songindex))))
    counts))))

存储在“计数”中的地图最初从函数“counting-origlabels”中检索。地图具有字符串键和整数值。它是600个左右的项目,并且迭代期间值会更新,但长度保持不变,我已经验证了这一点。

“orig-gen-pair”函数从文件中读取并返回一对短序列,每个序列大约10个。

“write-newlabels”函数只是将传递的序列命名为磁盘,没有任何其他副作用,也没有返回值。

“Pare-keywords”返回短序列和“计数”地图的更新版本。

我只是没有看到懒惰的序列可能导致这个问题!

非常感谢任何提示!

---- ---- EDIT

大家好,我已经更新了我的功能(希望是)更加惯用的Clojure。但我原来的问题仍然存在。首先,这是新代码:

(defn process-song [counts songindex]
  (let [[o g] (orig-gen-pair songindex)]
(if-not (seq o) ;;if no original labels
  (do
    (write-newlabels songindex g);then use the generated ones
    counts)
  (let [{labels :labels new-counts :countmap} (pare-keywords o g counts)] ;else pare the pairs
    (write-newlabels songindex labels)
    new-counts))))

(defn pare-all []
  (reduce process-song (counted-origlabels) (range *song-count*)))

这仍然以java.lang.StackOverflowError(repl-1:331)结束。堆栈跟踪对我来说并不意味着什么,除了它肯定表明懒惰的序列混乱正在发生。还有什么提示吗?我是否需要将代码发布到处理歌曲调用的函数中?谢谢!

1 个答案:

答案 0 :(得分:1)

如果没有更具体的示例数据,我无法完全掌握您要做的事情,但很明显您正在尝试使用递归迭代数据。你让事情变得比你需要的更痛苦。

如果你可以生成一个函数,让我们称它为do-the-thing,它可以在你的地图中使用一个条目正确运行,然后你就可以调用(映射do-the-thing(计数 - origlabels)),然后它将(do-the-thing)应用于(counting-origlabels)中的每个映射条目,将单个映射条目传递给do-the-thing,因为它是唯一的参数,并从do-the-thing返回seq的返回值。

您看起来也需要索引,这也很容易解决。你可以将懒惰序列(范围)拼接为do-the-thing的第二个参数,然后你将为每个map条目生成一系列索引;但是,默认情况下,clojure中的地图不会被排序,因此除非您使用有序地图,否则此索引值相对没有意义。

尝试抽象出你到目前为止所写的内容,尝试类似:

(defn do-the-thing [entry index counts]
  (let [[o g] (orig-gen-pair index)]
    (if-not (seq o)
      (write-newlabels index g)
      (let [{labels :labels new-counts :countmap} (pare-keywords o g counts)]
        (write-newlabels index labels)))))

(map do-the-thing (counted-origlabels) (range) (constantly (counted-origlabels)))