按字典顺序排列的字符串的非重复排列

时间:2014-05-02 11:50:53

标签: c string algorithm permutation

当我看到this时,我正在阅读关于字符串排列的生成。以下是帖子中提到的代码:

// Program to print all permutations of a string in sorted order.
#include <stdio.h>
#include <stdlib.h>
#include <string.h>

/* Following function is needed for library function qsort(). Refer
   http://www.cplusplus.com/reference/clibrary/cstdlib/qsort/ */
int compare (const void *a, const void * b)
{  return ( *(char *)a - *(char *)b ); }

// A utility function two swap two characters a and b
void swap (char* a, char* b)
{
    char t = *a;
    *a = *b;
    *b = t;
}

// This function finds the index of the smallest character
// which is greater than 'first' and is present in str[l..h]
int findCeil (char str[], char first, int l, int h)
{
    // initialize index of ceiling element
    int ceilIndex = l;

    // Now iterate through rest of the elements and find
    // the smallest character greater than 'first'
    for (int i = l+1; i <= h; i++)
      if (str[i] > first && str[i] < str[ceilIndex])
            ceilIndex = i;

    return ceilIndex;
}

// Print all permutations of str in sorted order
void sortedPermutations ( char str[] )
{
    // Get size of string
    int size = strlen(str);

    // Sort the string in increasing order
    qsort( str, size, sizeof( str[0] ), compare );

    // Print permutations one by one
    bool isFinished = false;
    while ( ! isFinished )
    {
        // print this permutation
        printf ("%s \n", str);

        // Find the rightmost character which is smaller than its next
        // character. Let us call it 'first char'
        int i;
        for ( i = size - 2; i >= 0; --i )
           if (str[i] < str[i+1])
              break;

        // If there is no such chracter, all are sorted in decreasing order,
        // means we just printed the last permutation and we are done.
        if ( i == -1 )
            isFinished = true;
        else
        {
            // Find the ceil of 'first char' in right of first character.
            // Ceil of a character is the smallest character greater than it
            int ceilIndex = findCeil( str, str[i], i + 1, size - 1 );

            // Swap first and second characters
            swap( &str[i], &str[ceilIndex] );

            // Sort the string on right of 'first char'
            qsort( str + i + 1, size - i - 1, sizeof(str[0]), compare );
        }
    }
}

// Driver program to test above function
int main()
{
    char str[] = "ABCD";
    sortedPermutations( str );
    return 0;
}

但是当字符串重复字母表(例如abca)时,此代码无法处理这种情况,因此会生成重复的排列。

我们如何更改此算法以按字典顺序生成非重复排列。或者还有其他方法吗?

2 个答案:

答案 0 :(得分:0)

您的示例中没有重复的字母,只是输入字母表中的字符。

我不会给你准备好代码但只是想知道如何处理重复项。它很简单,可能不是最有效的,但它并不坏,它将使代码工作。

您可以将其存储在将处理重复项的容器中,而不是明确地打印排列。

IMO词典树将有助于此目的。将大小为N的元素放入其中需要O(N),因此它实际上不会因Big-Oh而恶化时间复杂度(因为打印也需要O(N),例如任何类型的{{ 1}}操作)。你可以在那里计算dupes,或者如果元素存在则不做任何事情。

然后,您可以遍历树并打印非重复的条目。

答案 1 :(得分:0)

在David Eisenstat在评论中指出后,我运行程序并发现它没有打印重复项。我已经假设了这些代码将面临的某些问题,实际上它并没有。

我对代码工作原理的解释是: -

如果算法按字典顺序打印字符串,则只能连续打印重复项,如果您运行此算法,则可以看到它不会连续打印相同的字符串。如果重复的字符串没有在原件之后打印,则不能在其他任何地方打印,以免字典错误被打破