合并排序代码调试

时间:2013-09-21 04:15:39

标签: c++ algorithm sorting merge mergesort

我正在尝试编写合并排序的代码。我没有得到正确的输出。我关注this pseudocode链接以下是我的代码。我将未排序的数组传递给merge_sort函数并递归调用merge函数来对子数组进行排序和组合。我知道有更简单有效的方法来编写用于合并排序的代码但是我想尝试自己,否则我将不会学习。提前致谢。

int* merge_sort(int* a,int size)
{
    //cout<<size;
    //cout<<"hi";
    if(size == 1)
    {
        //cout<<"less";
        //cout<<a[0];

        return a;

    }
    int* left;
    int* right;

        int middle = ceil(size/2);
        left = new int(middle);
        right = new int(middle);
        for(int i=0;i<middle;i++)
        {
            left[i]=a[i];
            //cout<<left[i];
        }
        cout<<"\t";

        for(int j=middle;j<size;j++)
        {
            right[j]=a[j];
            //cout<<right[j];
        }
        cout<<"\t";
        left = merge_sort(left,middle);
        //if(size==2)
            //cout<<left[0];

        right = merge_sort(right,middle);
        //if(size==2)
            //cout<<right[0];

        return merge(left,right,middle);


}




int* merge(int* l,int* r,int m)
    {
        int* result;
        result = new int(2*m); //to store the output
        int lsize=m;  // to keep track of left sub list
        int rsize=m;  // to keep track of right sub list
        int counter = 0;  // will use to index result
        //cout<<m;


        while(lsize>0 || rsize>0)
        {
            if(lsize>0 && rsize>0)
            {
                if(l[0]<=r[0])
                {
                    result[counter]=l[0];
                    counter++; //to store next value in result
                    lsize--;  
                    l=&l[1]; //decrementing the size of left array
                }
                else
                {
                    result[counter]=r[0];
                    counter++;
                    rsize--; 
                    r=&r[1]; //dec. size of right array
                }

            }
            else if(lsize>0)
            {
                result[counter]=l[0];
                counter++;
                lsize--;
                l=&l[1];
            }
            else if(rsize>0)
            {
                result[counter]=l[0];
                counter++;
                lsize--;
                l=&l[1];
            }

        }
            return result;
    }

1 个答案:

答案 0 :(得分:3)

您的代码:

int *left = new int(middle);

分配一个初始化为middle的整数。你需要:

int *left = new int [middle];

分配一个middle整数数组。冲洗并重复int *right。实际上,你需要使用:

int *right = new int [size - middle];

这会获得right数组的正确大小。然后,您必须修改merge_sort()子阵列的right递归调用:

merge_sort(right, size - middle);

最后,您必须重写merge()以独立地获取左侧数组的大小和右侧数组的大小,因为它们可能具有不同的大小。例如,如果排序10个元素, 然后你最后调用合并两个5的数组(这很好),但是在下一个级别你需要合并一个2的数组和一个包含3个元素的数组(并且你已经被软化了)。

result的分配也存在() vs []分配问题。还有一些尚未解决的问题。但这些是朝着正确方向迈出的重要一步。

正如对问题的评论中所提到的,你也有一个巨大的内存泄漏问题。更重要的是,修复并不容易,因为merge_sort()在没有分配新内存的情况下提前退出,所以它不像'删除merge_sort()'返回的内存那么简单。

复制和粘贴很棒,直到您忘记正确编辑粘贴的副本:

    else if (lsize > 0)
    {   
        result[counter] = l[0];
        counter++;
        lsize--;
        l = &l[1];
    }   
    else if (rsize > 0)
    {   
        result[counter] = l[0];
        counter++;
        lsize--;
        l = &l[1];
    } 

您应该在第二个块中使用rrsize

这仍然不是全部故事......

剩下的问题(除了内存管理,仍然是100%泄漏和有问题)是:

    for(int j=middle;j<size;j++)
    {
        right[j]=a[j];
        //cout<<right[j];
    }

您要复制到未分配的right部分内容。你需要更像的东西:

    for(int j = 0; j < size - middle; j++)
    {
        right[j] = a[j + middle];
        //cout<<right[j];
    }

只要您始终在顶层排序至少两个项目(如果您对1项目进行排序,则会导致未分配的空间崩溃 - 这是内存管理问题的一部分),此代码可以正常工作。

#include <iostream>
using namespace std;

namespace {

int *merge(int *l, int m, int *r, int n);

void dump_array(int *a, int size)
{
    int i;
    cout << size << ": ";
    for (i = 0; i < size; i++)
    {
        cout << ' ' << a[i];
        if (i % 10 == 9)
            cout << '\n';
    }
    if (i % 10 != 0)
        cout << '\n';
}

};

int *merge_sort(int *a, int size)
{
    cout << "-->> merge_sort:\n";
    dump_array(a, size);
    if (size <= 1)
    {
        cout << "<<-- merge_sort: early return\n";
        return a;
    }

    int middle = size/2;
    int *left = new int[middle];
    int *right = new int[size - middle];
    cout << middle << ": ";
    for (int i = 0; i < middle; i++)
    {
        left[i] = a[i];
        cout << ' ' << left[i];
    }
    cout << "\n";

    cout << (size - middle) << ": ";
    for (int j = 0; j < size - middle; j++)
    {
        right[j] = a[j + middle];
        cout << ' ' << right[j];
    }
    cout << "\n";
    cout << "MSL:\n";
    int *nleft = merge_sort(left, middle);
    cout << "NL: ";
    dump_array(nleft, middle);
    cout << "OL: ";
    dump_array(left, middle);
    cout << "OR: ";
    dump_array(right, size - middle);
    cout << "MSR:\n";
    int *nright = merge_sort(right, size - middle);
    cout << "NR: ";
    dump_array(nright, size - middle);
    cout << "NL: ";
    dump_array(nleft, middle);
    cout << "OL: ";
    dump_array(left, middle);
    cout << "OR: ";
    dump_array(right, size - middle);
    int *result =  merge(nleft, middle, nright, size - middle);
    cout << "<<-- merge_sort:\n";
    dump_array(result, size);
    return result;
}

namespace {

int *merge(int *l, int m, int *r, int n)
{
    int *result = new int[m + n];
    int lsize = m;
    int rsize = n;
    int counter = 0;
    cout << "-->> merge: (" << m << "," << n << ")\n";
    dump_array(l, m);
    dump_array(r, n);

    while (lsize > 0 || rsize > 0)
    {
        if (lsize > 0 && rsize > 0)
        {
            if (l[0] <= r[0])
            {
                result[counter] = l[0];
                cout << "C: " << counter << "; L = " << l[0] << "; LS = " << lsize << '\n';
                counter++;
                lsize--;
                l++;
            }
            else
            {
                result[counter] = r[0];
                cout << "C: " << counter << "; R = " << r[0] << "; RS = " << rsize << '\n';
                counter++;
                rsize--;
                r++;
            }
        }
        else if (lsize > 0)
        {
            result[counter] = l[0];
            cout << "C: " << counter << "; L = " << l[0] << "; LS = " << lsize << '\n';
            counter++;
            lsize--;
            l++;
        }
        else if (rsize > 0)
        {
            result[counter] = r[0];
            cout << "C: " << counter << "; R = " << r[0] << "; RS = " << rsize << '\n';
            counter++;
            rsize--;
            r++;
        }
    }
    cout << "<<-- merge:\n";
    dump_array(result, m+n);
    return result;
}

};

int main()
{
    for (int i = 2; i <= 10; i++)
    {
        int array1[] = { 9, 3, 5, 7, 1, 8, 0, 6, 2, 4 };
        cout << "\nMerge array of size " << i << "\n\n";
        int *result = merge_sort(array1, i);
        delete[] result;
    }
    return 0;
}

这是调试代码。这是我获得结果的水平。我或许可以使用调试器。如果我在valgrind工作的机器上,它可能也有帮助(但它不适用于Mac OS X 10.8.x,遗憾的是)。

还有很多方法可以改进代码 - 包括内存管理。您可能会发现最简单的方法是将输入数组传递给merge()以用作结果数组(避免在该代码中进行内存分配)。这会减少内存管理负担。

当您删除调试代码时,您需要调用dump_array()程序中的main()函数来获取排序数组图像之前和之后的信息。


代码转换为模板功能且无泄漏

我已经简化了代码,特别是在merge()函数中。此外,更多的是好奇心而不是其他任何东西,将其转换为一组模板函数,然后将它们用于4种不同的数组类型(intdoublestd::string,{ {1}})。调试量已大大减少,主要调试的条件是现在使用char进行编译。

代码现在没有泄漏; Linux盒(虚拟机)上的-DTRACE_ENABLED在没有例外的情况下为其提供干净的健康状况。但是,不保证例外安全。事实上,鉴于valgrindnew的裸体用途,几乎可以保证不会出现例外情况。我已经离开了delete控件了,但我并不相信这是非常正确的 - 事实上,我确定它不是很好。 (我也很好奇是否有人对如何在namespace ... namespace {块中布局代码有任何意见;看起来奇怪的是没有缩进一组括号中的所有内容,但是......)

};