我刚刚实现了这两种算法,当我绘制结果时我很惊讶!递归实现显然比迭代实现快。 之后,我将插入排序与两者结合起来,结果是相同的。
在讲课中,我们经常看到像阶乘一样,递归比迭代慢,但在这里似乎并非如此。我很确定我的代码是正确的。 此行为的解释是什么?看起来java(10)在递归模式下自动实现了多线程,因为当我显示插入排序与合并操作并行工作的小动画时,会出现这种情况。
如果这些代码不足以理解,请参阅我的github:Github
编辑已重新加载 如评论中所述,我应该比较相似的事物,所以现在合并方法在迭代和递归上都是相同的。
private void merge(ArrayToSort<T> array, T[] sub_array,
int min, int mid, int max) {
//we make a copy of the array.
if (max + 1 - min >= 0) System.arraycopy(array.array, min, sub_array, min, max + 1 - min);
int i = min, j = mid + 1;
for (var k = min; k <= max; k++) {
if (i > mid) {
array.array[k] = sub_array[j++];
} else if (j > max) {
array.array[k] = sub_array[i++];
} else if (sub_array[j].compareTo(sub_array[i]) < 0) {
array.array[k] = sub_array[j++];
} else {
array.array[k] = sub_array[i++];
}
}
}
递归排序:
public void Sort(ArrayToSort<T> array) {
T sub[] = (T[]) new Comparable[array.Length];
sort(array, sub, 0, array.Length - 1);
}
private InsertionSort<T> insertionSort = new InsertionSort<>();
private void sort(ArrayToSort<T> array, T[] sub_array, int min, int max) {
if (max <= min) return;
if (max <= min + 8 - 1) {
insertionSort.Sort(array, min, max);
return;
}
var mid = min + (max - min) / 2;
sort(array, sub_array, min, mid);
sort(array, sub_array, mid + 1, max);
merge(array, sub_array, min, mid, max);
}
排序迭代:
private InsertionSort<T> insertionSort = new InsertionSort<>();
public void Sort(ArrayToSort<T> array) {
int length = array.Length;
int maxIndex = length - 1;
T temp[] = (T[]) new Comparable[length];
for (int i = 0; i < maxIndex; i += 8) {
insertionSort.Sort(array, i, Integer.min(i + 8 - 1, maxIndex));
}
System.arraycopy(array.array, 0, temp, 0, length);
for (int m = 8; m <= maxIndex; m = 2 * m) {
for (int i = 0; i < maxIndex; i += 2 * m) {
merge(array, temp, i, i + m - 1,
Integer.min(i + 2 * m - 1, maxIndex));
}
}
}
在新图中,我们可以看到现在差异是成比例的(àunfactoreurprès)。如果有人还有其他想法...非常感谢:)
新*新情节
这是我(实际上是老师的)绘图方法:
for (int i = 0; i < nbSteps; i++) {
int N = startingCount + countIncrement * i;
for (ISortingAlgorithm<Integer> algo : algorithms) {
long time = 0;
for (int j = 0; j < folds; j++) {
ArrayToSort<Integer> toSort = new ArrayToSort<>(
ArrayToSort.CreateRandomIntegerArray(N, Integer.MAX_VALUE, (int) System.nanoTime())
);
long startTime = System.currentTimeMillis();
algo.Sort(toSort);
long endTime = System.currentTimeMillis();
time += (endTime - startTime);
assert toSort.isSorted();
}
stringBuilder.append(N + ", " + (time / folds) + ", " + algo.Name() + "\n");
System.out.println(N + ", " + (time / folds) + ", " + algo.Name());
}
}
答案 0 :(得分:0)
我没有答案,因为我没有尝试您的代码。 我会给你的想法:
a)CPU具有L1高速缓存和指令预取。在完成所有排序后,递归版本可能具有更好的引用局部性,并且在弹出所有帧(出于其他cpu优化原因)的同时完成了一堆合并操作
b)同时,JIT编译器对递归做了疯狂的事情,特别是由于尾递归和内联。我建议您尝试不使用JIT编译器只是为了好玩。也可能想尝试更改JIT编译的阈值,以便更快地编译JIT以最小化预热时间。
c)system.arraycopy是一种本机方法,尽管已进行了优化,但应该有开销。
d)迭代版本在循环中似乎有更多的算法。
e)尝试进行微基准测试。您需要排除GC并让测试运行数十次(即使不是数百次)。阅读JMH。还可以尝试使用其他GC和-Xmx。