C

时间:2015-09-01 00:54:01

标签: c algorithm string-algorithm

写一个函数

void inplace(char *str, 
             const char pattern, 
             const char* replacement, 
             size_t mlen)

输入:
str:以\0结尾的字符串。输入表明我们需要一个就地算法。

pattern:一封信。

replacement:一个字符串。

mlen:内存大小保持字符串str从内存开头开始,mlen应大于strlen(str)

最终结果仍由str指出。

请注意,应替换所有出现的模式。

例如,

helelo\0...........

在这里" helelo"是最后用'\0'替换的字符串。 '\0'之后仍有L个有效字节。我们想要取代" e" by" 123"。

一个简单的方法就是这样,我们通过str,当一个模式匹配时,我们将所有其余部分移动到地方以填充替换字符串,然后用替换替换模式。

如果原始字符串的长度为n且仅包含e,则我们需要(n-1) + (n-2) + ... + 1次移位。

  

是否有一种算法仅使用一次传递和常量内存成本扫描字符串?

3 个答案:

答案 0 :(得分:2)

我认为两次通过是最低限度的。在第一遍中,计算要替换的字符数。鉴于count和替换字符串的长度,您可以计算最终字符串的长度。 (你应该验证它是否适合缓冲区。)

在第二遍中,您向后扫描字符串(从最后一个字符开始),将字符复制到最终位置。遇到搜索字符时,请将替换字符串复制到该位置。

在你的例子中,长度的增加将是2.所以你会

copy str[5] which is '\0' to str[7]
copy str[4] which is 'o' to str[6]
copy str[3] which is 'l' to str[5]
copy str[2] which is 'l' to str[4]
at str[1] you find the 'e' so str[3]='3' str[2]='2' str[1]='1'

此时输出索引与输入索引相同,因此您可以打破循环。

正如@chux在注释中指出的那样,替换字符串为空或者只有一个字符的情况可以通过字符串中的单个正向传递来处理。所以代码应该单独处理这些情况。

答案 1 :(得分:1)

候选单程解决方案。

对于str中的每个字符,递归。在递归之后,进行替换。

大量递减。

#include <stdio.h>
#include <math.h>
#include <stdlib.h>
#include <string.h>

// return 0:success else 1:fail
static int inplace_help(char *dest, const char *src, int pattern,
        const char* replacement, size_t rlen, size_t mlen) {
  printf("'%p' '%s' %c\n", dest, src, pattern);
  if (*src == pattern) {
    if (rlen > mlen) return 1;
    if (inplace_help(dest + rlen, src + 1, pattern, replacement, rlen,
            mlen - rlen)) return 1;
    memcpy(dest, replacement, rlen);
    return 0;
  }
  if (mlen == 0) return 1;
  int replace1 = *src;
  if (*src) {
    if (inplace_help(dest + 1, src + 1, pattern, replacement, rlen, mlen - 1)) {
      return 1;
    }
  }
  *dest = replace1;
  return 0;
}

void inplace(char *str, const char pattern, const char* replacement,
        size_t mlen) {
  if (pattern == 0) return;
  if (mlen == 0) return;
  if (*replacement == 0) return;  // Insure str does not shrink.
  inplace_help(str, str, pattern, replacement, strlen(replacement), mlen - 1);
}

int main(void) {
  char str[1000] = "eeeeec";
  inplace(str, 'e', "1234", sizeof str);
  printf("'%s'\n", str);  // --> '12341234123412341234c'
  return 0;
}

答案 2 :(得分:0)

以下假设分配给字符串的内存在某个时间点已初始化为某些内容,因为标准C似乎不允许访问未初始化的内存。在实践中,它会正常工作。

它确实进行了两次扫描:第一次扫描在整个分配的空间上,并将字符串移动到空间的右边缘。第二次扫描在字符串本身上方,它在替换时会移回到左边缘。

我改变了原型,成功时返回0; -1失败。我也允许模式为字符串。 (也许单个字符是有意的?无论如何都很容易改变。)(如上所述,模式不能为零长度。应该检查。)

int inplace(char *str, 
            const char* pattern, 
            const char* replacement, 
            size_t mlen) {
  /* We don't know how long the string is, but we know that it ends
     with a NUL byte, so every time we hit a NUL byte, we reset
     the output pointer.
   */
  char* left = str + mlen;
  char* right = left;
  while (left > str) {
    if (!*--left) right = str + mlen;
    *--right = *left;
  }

  /* Naive left-to-right scan. KMP or BM would be more efficient. */

  size_t patlen = strlen(pattern);
  size_t replen = strlen(replacement);
  for (;;) {
    if (0 == strncmp(pattern, right, patlen)) {
      right += patlen;
      if (right - left < replen) return -1;
      memcpy(left, replacement, replen);
      left += replen;
    } else {
      if (!(*left++ = *right++)) break;
    }
  }
  return 0;
}