C ++中的MSD Radix-sort(字典顺序)

时间:2018-10-26 17:15:49

标签: c++ algorithm sorting c++11 recursion

感谢您阅读这篇文章。

我想创建一个MSD基数排序,该排序应该按字典顺序(字母顺序)对无符号整数的向量进行排序。

给出“ 1、3、32、1254、3、165、50000、11、213”

排序为“ 1、11、1254、165、213、3、3、32、50000”

由于我认为我应该递归进行操作,因此我尝试捕获最高位,并用所有数字的下一位递归调用该函数。但是,我只是意识到我弄错了逻辑,因为这会按照常规的数字顺序进行排序,因为我从具有相同数字的最高数字开始对所有数字进行迭代(例如,第5个数字,对于没有更多数字的数字可能为0)超过5位数)。因此我放弃了该算法,但无法提出新的想法。

因为这可以处理任何数字,所以它应该递归操作。我现在有一些想法,但是它们似乎没有用:

  1. 因为这类似于字母顺序,所以我可以使用std::to_string()std::sort()将整数更改为字符串,但是我认为这不是一个好选择,因为它不再寻找算法结果,我不知道如何将字符串改回 unsigned 整数。
  2. 我想通过重复除以10直到结果小于10来找到最大的数字,然后按这个数字对每个数字进行排序,但是由于数字的数字不同,它不起作用,因此我无法递归地执行通过划分,我已经丢失了大部分数据。我认为我仍然坚持使用数字排序模型。当我们无法确定固定数字或要比较的任何可能点时,我真的看不到使递归成为可能的步骤,因此我们可以实现递归排序。

您对这种不同类型的数字排序有什么实现想法吗?

1 个答案:

答案 0 :(得分:1)

#include <vector>
#include <algorithm>
#include <iostream>
#include <array>
#include <numeric>
#include <cassert>

namespace details
{
    const int kNoDigit = -1;
    int ExtractDigit(int i, int pos) {
        const int digitsCount = log10(i) + 1;
        if (pos > digitsCount) return kNoDigit;
        return (int)(i / pow(10, digitsCount - pos)) % 10;
    }

    // For pos equals to 2 and {10 20 1} -> {0, 1, 3, 3, ...},
    // 1 ends with empty digit in the second digit and 2 ends with 0
    template <class It>
    auto CountingSort(It begin, It end, int pos) {
        std::array<int, 12> bins;
        std::fill(bins.begin(), bins.end(), 0);
        for (auto it = begin; it < end; ++it) {
            const int digit = ExtractDigit(*it, pos);
            ++bins[digit + 1];
        }
        std::partial_sum(bins.cbegin(), bins.cend(), bins.begin());
        std::move(bins.cbegin(), bins.cend() - 1, bins.begin() + 1);
        return bins;
    }

    template <class It>
    void MsdRadixInternal(It begin, It end, int pos) {
        const auto bins = CountingSort(begin, end, pos);
        // We finish when i is 1, because the last part ends up sorted anyway
        for (int i = 10; i > 0; --i) {
            const int digit = i - 1;
            const auto local_begin = begin + bins[i];
            const auto local_end = begin + bins[i + 1];
            if (local_begin == begin) break;
            if (std::distance(local_begin, local_end) > 0) {
                auto crsrForward = begin;
                auto crsrBackward = local_end - 1;
                while (crsrForward < crsrBackward) {
                    assert(crsrForward < local_begin && local_begin <= crsrBackward);
                    while (ExtractDigit(*crsrBackward, pos) == digit) --crsrBackward;
                    while (ExtractDigit(*crsrForward, pos) != digit) ++crsrForward;
                    if (crsrForward < local_begin) {
                        std::swap(*crsrBackward, *crsrForward);
                    }
                    ++crsrForward;
                }
            }
        }
        // Start from 1 as we don't want to sort numbers wich are out of digits in pos already
        for (int i = 1; i < 11; ++i) {
            if (bins[i + 1] - bins[i] > 1)
                MsdRadixInternal(begin + bins[i], begin + bins[i + 1], pos + 1);
        }
    }
}

template <class It>
void MsdRadix(It begin, It end) {
    details::MsdRadixInternal(begin, end, 1);
}

int main()
{
    std::vector<int> v = { 1, 3, 32, 1254, 3, 165, 50000, 11, 213 };
    MsdRadix(v.begin(), v.end());
    std::copy(v.begin(), v.end(), std::ostream_iterator<int>(std::cout, " "));
    return 0;
}
  

1 11 1254 165 213 3 3 32 50000

此实现并非旨在提高效率,例如提取数字可以以更快的方式实现。