我有2种排序算法,合并排序和插入排序。我试图检查它们在执行过程中分配了多少内存,以进行比较。两者都在对1000个元素的数组进行排序,整数在0-999之间。
程序被编译为名为main
(merge_sort/main
和insertion_sort/main
)的二进制文件。所以我正在跑步:
memusage -T ./main
两种算法。
都返回:
heap total: 73728, heap peak: 73728, stack peak: 6144
为什么它们返回相同的?合并排序是否应该分配比插入排序更多的内存?我什至使用memusage
正确吗?
我也尝试过使用Valgrind对其进行检查,这对于两个对象也都返回相同的结果:
==26544== HEAP SUMMARY:
==26544== in use at exit: 0 bytes in 0 blocks
==26544== total heap usage: 2 allocs, 2 frees, 73,728 bytes allocated
我的理论是:要么我不知道自己在做什么,
或者排序的列表很小。因此,内存使用情况看起来相同。
代码:
合并排序
/* C program for Merge Sort */
#include<stdlib.h>
#include<stdio.h>
#include<time.h>
// Merges two subarrays of arr[].
// First subarray is arr[l..m]
// Second subarray is arr[m+1..r]
void merge(int arr[], int l, int m, int r)
{
int i, j, k;
int n1 = m - l + 1;
int n2 = r - m;
/* create temp arrays */
int L[n1], R[n2];
/* Copy data to temp arrays L[] and R[] */
for (i = 0; i < n1; i++)
L[i] = arr[l + i];
for (j = 0; j < n2; j++)
R[j] = arr[m + 1+ j];
/* Merge the temp arrays back into arr[l..r]*/
i = 0; // Initial index of first subarray
j = 0; // Initial index of second subarray
k = l; // Initial index of merged subarray
while (i < n1 && j < n2)
{
if (L[i] <= R[j])
{
arr[k] = L[i];
i++;
}
else
{
arr[k] = R[j];
j++;
}
k++;
}
/* Copy the remaining elements of L[], if there
are any */
while (i < n1)
{
arr[k] = L[i];
i++;
k++;
}
/* Copy the remaining elements of R[], if there
are any */
while (j < n2)
{
arr[k] = R[j];
j++;
k++;
}
}
/* l is for left index and r is right index of the
sub-array of arr to be sorted */
void mergeSort(int arr[], int l, int r)
{
if (l < r)
{
// Same as (l+r)/2, but avoids overflow for
// large l and h
int m = l+(r-l)/2;
// Sort first and second halves
mergeSort(arr, l, m);
mergeSort(arr, m+1, r);
merge(arr, l, m, r);
}
}
/* UTILITY FUNCTIONS */
/* Function to print an array */
void printArray(int A[], int size)
{
int i;
for (i=0; i < size; i++)
printf("%d ", A[i]);
printf("\n");
}
/* Driver program to test above functions */
int main()
{
int arr[] = {

};
int n = sizeof(arr)/sizeof(arr[0]);
clock_t begin = clock();
/* here, do your time-consuming job */
mergeSort(arr, 0, n-1);
clock_t end = clock();
double time_spent = (double)(end - begin) / CLOCKS_PER_SEC;
printf("Merge: %.10f", time_spent);
printf("\n");
return 0;
}
插入排序
// C program for insertion sort
#include <math.h>
#include <stdio.h>
#include <time.h>
#include <unistd.h>
/* Function to sort an array using insertion sort*/
void insertionSort(int arr[], int n)
{
int i, key, j;
for (i = 1; i < n; i++) {
key = arr[i];
j = i - 1;
/* Move elements of arr[0..i-1], that are
greater than key, to one position ahead
of their current position */
while (j >= 0 && arr[j] > key) {
arr[j + 1] = arr[j];
j = j - 1;
}
arr[j + 1] = key;
}
}
// A utility function to print an array of size n
void printArray(int arr[], int n)
{
int i;
for (i = 0; i < n; i++)
printf("%d ", arr[i]);
printf("\n");
}
/* Driver program to test insertion sort */
int main()
{
int arr[] = {

};
int n = sizeof(arr)/sizeof(arr[0]);
//printf("n: %d", n);
//printf("Unsorted array: ");
//printArray(arr, n);
//printf("\n");
clock_t begin = clock();
/* here, do your time-consuming job */
insertionSort(arr, n);
clock_t end = clock();
double time_spent = (double)(end - begin) / CLOCKS_PER_SEC;
//printf("Sorted array: ");
//printArray(arr, n);
//printf("\n");
printf("Inser: %.10f", time_spent);
printf("\n");
return 0;
}
答案 0 :(得分:1)
您报告的memusage
和valgrind
结果彼此一致:每个显示总共动态分配了73728个字节。那里应该就让您暂停一下,因为 您的源代码中没有对动态内存分配函数的调用 。这些字节与您的排序功能无关;它们必须来自标准库在其设置代码或您调用的少数库函数之一中执行的分配。
由于memusage
和它依赖的libmemusage.so
是由glibc提供的,因此我们不希望他们报告glibc的使用情况,实际上,对我而言,他们没有。我无法解释为什么您会看到不同的结果,但是作为一个疯狂的猜测,也许您使用的是glibc和libmemusage.so的不匹配版本。
但是,您可能会说,堆栈使用情况如何?两种方法不应该使用不同数量的堆栈吗?并且他们不应该使用 some 堆栈,而不是注释中报告的0吗?在这里,您必须了解底层的libmemusage是通过包装选定的内存分配函数而不是 all 函数来运行的。对于the memusage
docs,它按如下方式计算堆栈使用量:
在第一次调用任何 受监视的 函数之前,堆栈指针 地址(基本堆栈指针)已保存。在每个[受监视的]函数调用之后, 读取实际的堆栈指针地址,并且与基地址的区别 计算堆栈指针。这些差异的最大值就是 堆峰。
(添加了强调。)因此,
memusage
仅提供堆栈使用情况的估计,该估计是通过对受监视函数的调用周围的堆栈指针进行采样来完成的。
因此,对于您的特定程序,memusage
不会报告有关排序算法的堆栈使用情况的任何信息,因为您的代码不会调用受监视的函数。
您可以通过手动检测代码来解决此问题,以便libmemusage
查看其堆栈使用情况。例如,插入
free(malloc(0));
在main()
的开头,以确保记录了堆栈使用的最低点,并插入对诸如以下函数的调用:
void usage_instrumentation(void) {
free(malloc(0));
}
进入其他每个功能。为了捕获调用函数的堆栈使用情况,应在main
以外的地方使用函数调用; malloc
和free
应该在main
中直接调用以捕获低点 main
的用法,以便将该用法包括在最终估算。此外,请在禁用函数内联(可能包括所有优化)的情况下进行编译,以避免此机制被编译器破坏。
如果我这样做,对我来说,memusage
报告插入排序的堆栈使用量为4304字节,合并排序的堆栈使用量为8496字节,两者的差值比数组的大小稍大。就像我期望的那样。