如何在c中找到两个字符串之间的文本

时间:2014-07-11 10:58:45

标签: c string char ansi strstr

我需要在c。

中的2个字符串模式之间提取文本

示例:

aaaaaa<BBBB>TEXT TO EXTRACT</BBBB>aaaaaaaaa

PATTERN1=<BBBB>
PATTERN2=</BBBB>

感谢。

3 个答案:

答案 0 :(得分:4)

只需使用strstr()

首先找到开始标记,然后使用指向开始标记后第一个字符的指针再次调用它,以找到结束标记:

char * extract_between(const char *str, const char *p1, const char *p2)
{
  const char *i1 = strstr(str, p1);
  if(i1 != NULL)
  {
    const size_t pl1 = strlen(p1);
    const char *i2 = strstr(i1 + pl1, p2);
    if(p2 != NULL)
    {
     /* Found both markers, extract text. */
     const size_t mlen = i2 - (i1 + pl1);
     char *ret = malloc(mlen + 1);
     if(ret != NULL)
     {
       memcpy(ret, i1 + pl1, mlen);
       ret[mlen] = '\0';
       return ret;
     }
    }
  }

请逐一测试以上内容,我写得很快。       返回NULL;     }

这可能不是性能上的最佳选择,但对于实现,正确,阅读和理解都非常简单。

答案 1 :(得分:4)

这是一个如何做到这一点的活生生的例子

#include <stdio.h>
#include <string.h>

int main(void)
{
    const char *s = "aaaaaa<BBBB>TEXT TO EXTRACT</BBBB>aaaaaaaaa";

    const char *PATTERN1 = "<BBBB>";
    const char *PATTERN2 = "</BBBB>";

    char *target = NULL;
    char *start, *end;

    if ( start = strstr( s, PATTERN1 ) )
    {
        start += strlen( PATTERN1 );
        if ( end = strstr( start, PATTERN2 ) )
        {
            target = ( char * )malloc( end - start + 1 );
            memcpy( target, start, end - start );
            target[end - start] = '\0';
        }
    }

    if ( target ) printf( "%s\n", target );

    free( target );

    return 0;
}

输出

TEXT TO EXTRACT

答案 2 :(得分:-2)

char * start = strstr(PATTERN1, text);
char * end = strstr(PATTERN2, text);

if (end == NULL || start == NULL)
    return;

*end = '\0';

printf("%s\n", start);

注意:如果您无法修改原始字符串,请将其复制到可以播放的缓冲区中。

替代版本:

char * start = strstr(PATTERN1, text);
char * end = strstr(PATTERN2, text);

if (end == NULL || start == NULL)
    return;

int len = end - start;

if (len <= 0)
     return;

char * parsed = (char *)calloc(len+1, sizeof(char));

if (parsed == NULL)
     return;

memcpy(parsed, start, len);

printf("%s\n", parsed);

free(parsed);

ps:我还没有测试任何代码