将字符串转换为另一个字符串的最小交换数

时间:2014-05-15 14:26:20

标签: c algorithm

问题陈述:

找到将一个字符串转换为另一个字符串的最小交换次数,该字符串可能有也可能没有重复字符;允许任意交换。

min_swaps('kamal', 'amalk') -> 3
#       1         2        3
# kamal -> lamak -> aamlk -> amalk

注意:SO上有很多这样的问题,但似乎没有一个适用于任意交换。

初步方法:

let s1 = 'kamal'
let s2 = 'amalk'

假设s1是"正确"排序,即它的元素按递增顺序映射到0 -> N-1的序列。

0 1 2 3 4
k a m a l

现在创建一个数组P,它是s2中字母到s1中正确索引的映射:

1 2 3 4 0
a m a l k 

P = [1,2,3,4,0]

现在我们可以使用修改后的mergesort计算P中数组反转的数量,这将为我们提供乱序的元素数量。

修改后的mergesort:

int main(int argc, char ** argv) {
   int array[] = { 1,2,3,4,0 };

   int array_size = sizeof(array)/sizeof(array[0]);
   int inversions = merge_sort(array, 0, array_size - 1);

   printf("Found %d inversions\n", inversions);
   return 0;
}

int merge_sort(int a[], int start, int end) {
   if ( end > start ) {
      int mid = start + (end - start) / 2;
      int x = merge_sort(a, start, mid);
      int y = merge_sort(a, mid + 1, end);
      int z = merge(a, start, mid, end);

      return x + y + z;
   }

   return 0;
}

int merge(int a[], int start, int mid, int end) {
   int l = start, r = mid + 1;
   int i = 0;
   int temp[end - start + 1];
   int splitInversionCount = 0;

   while ( l <= mid && r <= end ) {
       if ( a[l] < a[r] ) {
          temp[i++] = a[l++];
       }
       else {
         splitInversionCount += mid - l + 1;
         temp[i++] = a[r++];
       }
   }

   // copy whichever half of the array remains
   while ( l <= mid ) {
      temp[i++] = a[l++];
   }

   while ( r <= end ) {
      temp[i++] = a[r++];
   }

   // copy temp back into a
   int k;
   for(k = 0; k < i; k++) {
      a[k + start] = temp[k];
   }

   return splitInversionCount;
}

这样做的问题在于,它只提供了仅包含相邻元素的最小交换次数,这将返回4而不是3

问题:

有没有办法扩展此算法以捕获任意交换?或者我需要一种完全不同的方法吗?

1 个答案:

答案 0 :(得分:2)

我还没有一个完整的解决方案,但我认为说明这一点可以帮助他人是有用的。

我们假设字符串的大小为N。让我们调用k已经在其位置的字符数。最初是k <= N

交换可以有:

  1. 在正确的位置设置2个字符。将k提高2
  2. 将1个字符设置在正确的位置。将k增加1
  3. 没有任何用处,k保持不变。
  4. 你总是可以移动第二种,你可以在O(n)时间内找到它。只需从pos中取出一个角色,找到它需要的位置,然后交换。

    当你看到第一种类型时,你不应该交换第一种类型,因为你可以打破同时设置2个字符的其他移动。如果你这样做,你最终可以在3个动作中设置4个字符,而你可以在2个时间内完成。

    进行第三种移动可能允许进行第一种移动,因此所有三种移动都很有用。