清理所有空格和换行符C或Lex / Bison

时间:2013-04-21 21:31:57

标签: c bison lex

我需要清理Lex / Bison程序中yytext的所有空格和换行符(\ n)。

我有这样的主张:

<PROPERTY>[^}]* TAG=yytext;

我需要它将我的所有CSS代码文件解析为HTML标记。

我试过这样的事情:

sizeOfArray=strlen(TAG);
int i;
for(i=0; i<sizeOfArray; i++){
    memmove(TAG,TAG+1,len);
}

没有成功......

编辑:

我只想清理属性之前和之后的空格。

示例:

 body {
         background: black;
         color: #80c0c0
         }

因为我想把这些行放在我的HTML文件上,就像这样:

<body style="background:black; color:#80c0c0;"> 

1 个答案:

答案 0 :(得分:1)

未经测试,但如果isspace()中的<ctype.h>与您要跳过的字符(空格,制表符,换行符)匹配,则应该有效:

int sizeOfArray = strlen(TAG);
int i, j;
for (i = j = 0; i < sizeOfArray; i++)
{
    if (!isspace(TAG[i]))
        TAG[j++] = TAG[i];
}
TAG[j] = '\0';

如评论中所述,此代码应实现'对于一个或多个换行符或空格的每个序列,保留单个空格;通过不变的'复制其他字符',再次假设isspace()是一个合适的函数 - 例如,在标准C库中也有isblank()

int sizeOfArray = strlen(TAG);
int i, j;
for (i = j = 0; i < sizeOfArray; i++)
{
    if (isspace(TAG[i]))
    {
        while (i < sizeOfArray && isspace(TAG[i]))
            i++;
        if (TAG[i] != '\0')
            TAG[j++] = ' ';
    }
    TAG[j++] = TAG[i];
}
TAG[j] = '\0';

现在使用此SSCCE(Short, Self-Contained, Correct Example)测试:

#include <ctype.h>
#include <stdio.h>
#include <string.h>

static void squish_whitespace(char *TAG)
{
    int sizeOfArray = strlen(TAG);
    int i, j;
    for (i = j = 0; i < sizeOfArray; i++)
    {
        if (isspace(TAG[i]))
        {
            while (i < sizeOfArray && isspace(TAG[i]))
                i++;
            if (TAG[i] != '\0')
                TAG[j++] = ' ';
        }
        TAG[j++] = TAG[i];
    }
    TAG[j] = '\0';
}

int main(void)
{
    char data[][80] =
    {
        "abc def ghi",
        "abc  def   \t\t\n\nghi",
        "abc  def  ghi   ",
        "body {\n"                        // NB: string concatenation
        "        background: black;\n"
        "        color: #80c0c0\n"
        "     }"
    };
    enum { NUM_DATA = sizeof(data) / sizeof(data[0]) };

    for (size_t i = 0; i < NUM_DATA; i++)
    {
        printf("Before: [[%s]]\n", data[i]);
        squish_whitespace(data[i]);
        printf("After:  [[%s]]\n", data[i]);
    }
    return 0;
}

测试数据的输出:

Before: [[abc def ghi]]
After:  [[abc def ghi]]
Before: [[abc  def          

ghi]]
After:  [[abc def ghi]]
Before: [[abc  def  ghi   ]]
After:  [[abc def ghi]]
Before: [[body {
        background: black;
        color: #80c0c0
     }]]
After:  [[body { background: black; color: #80c0c0 }]]