Clojure中的Heap算法(可以高效实现吗?)

时间:2015-11-01 18:50:14

标签: arrays performance recursion clojure

Heap的算法枚举了数组的排列。 Wikipedia's article on the algorithm说Robert Sedgewick认为算法是“当时用计算机生成排列的最有效算法”,所以自然会尝试实现这种算法。

算法就是在可变数组中进行一系列交换,所以我在Clojure中实现它,它的序列是不可变的。我把以下内容放在一起,完全避免了可变性:

(defn swap [a i j]
  (assoc a j (a i) i (a j)))

(defn generate-permutations [v n]
  (if (zero? n)
    ();(println (apply str a));Comment out to time just the code, not the print
    (loop [i 0 a v]
      (if (<= i n)
        (do
          (generate-permutations a (dec n))
          (recur (inc i) (swap a (if (even? n) i 0) n)))))))

(if (not= (count *command-line-args*) 1)
  (do (println "Exactly one argument is required") (System/exit 1))
  (let [word (-> *command-line-args* first vec)]
    (time (generate-permutations word (dec (count word))))))

对于11个字符的输入字符串,该算法在7.3秒内(在我的计算机上)运行(平均超过10次)。

使用字符数组的等效Java程序在0.24秒内运行。

所以我想让Clojure代码更快。我使用了带有类型提示的Java数组。这就是我试过的:

(defn generate-permutations [^chars a n]
  (if (zero? n)
    ();(println (apply str a))
    (doseq [i (range 0 (inc n))]
      (generate-permutations a (dec n))
      (let [j (if (even? n) i 0) oldn (aget a n) oldj (aget a j)]
        (aset-char a n oldj) (aset-char a j oldn)))))

(if (not= (count *command-line-args*) 1)
  (do
    (println "Exactly one argument is required")
    (System/exit 1))
  (let [word (-> *command-line-args* first vec char-array)]
    (time (generate-permutations word (dec (count word))))))

嗯,。现在,11个字符的数组平均为9.1秒(即使是类型提示)。

我理解可变数组不是Clojure方式,但是有没有办法在这个算法中接近Java的性能?

1 个答案:

答案 0 :(得分:2)

并不是说Clojure完全是为了避免可变状态。 Clojure对何时应该使用它有非常强烈的意见。

在这种情况下,我强烈建议您使用瞬态来找到重写算法的方法,因为它们专门设计为避免重新分配内存并允许时间来节省时间只要对集合的引用永远不会离开创建它的函数,就可以在本地使用可变集合。我最近设法通过使用它们将内存密集型操作的时间缩短了近10倍。

这篇文章相当好地解释了瞬态!

http://hypirion.com/musings/understanding-clojure-transients

此外,您可能希望以允许您使用recur递归调用generatePermutations而不是使用整个名称的方式来重写循环结构。您可能会获得性能提升,并且对堆栈征税的次数要少得多。

我希望这会有所帮助。