在re2c中使用YYLIMIT

时间:2014-07-02 02:06:19

标签: re2c

提前谢谢!

我想实现一个代码来分析ipv4地址格式,例如" 192.168.0.0"。

所以,我确实喜欢这个。

#include <stdio.h>
#include <string.h>

typedef struct qppLexerObj
{
    char *mCursor;
    char *mLimit;
    char *mToken;

} qppLexerObj;

int qpfGetOctet(qppLexerObj *aLexer)
{
#define YYFILL(a)                                       \
    do                                                  \
    {                                                   \
        if (aLexer->mCursor > aLexer->mLimit)           \
        {                                               \
            return 0;           \
        }                                               \
        else                                            \
        {                                               \
        }                                               \
    } while (0);

    /*!re2c

      re2c:define:YYCTYPE     = "unsigned char";
      re2c:define:YYCURSOR    = aLexer->mCursor;
      re2c:define:YYLIMIT     = aLexer->mLimit;
      re2c:yyfill:enable      = 0;
      re2c:yyfill:enable      = 1;

      digit   = [0-9];
    */
begin:
    aLexer->mToken = aLexer->mCursor;
    /*!re2c

      digit+ { return 1; }
      [\.]        { return 2;      }
      [\*]        { return 3;     }
      .           { return 9999;  }
    */
}


int main()
{
    qppLexerObj aObj;
    int a;
    char sToken[512];
    char *sBuffer = "255.255.255.255";

    aObj.mCursor = sBuffer;
    aObj.mLimit  = aObj.mCursor + strlen(sBuffer);

    while ( (a = qpfGetOctet(&aObj)) != 0)
    {
        int len;

        len = aObj.mCursor - aObj.mToken;

        memset(sToken, 0, sizeof(sToken));
        strncpy(sToken, aObj.mToken, len);
        printf("Token = %d(%d) [%s]\n", a, len, sToken);
    }

    return 0;
}

但是,结果并不是我的预期。

re2c --case-insensitive -o addr_so.c addr_so.re
gcc -g -o addr_so addr_so.c

Token = 1(3) [255]
Token = 2(1) [.]
Token = 1(3) [255]
Token = 2(1) [.]
Token = 1(3) [255]
Token = 2(1) [.]
Token = 1(3) [255]
Token = 9999(1) []     <=== Wrong code happens!! SHOULD BE 0!

如何在没有&#34; 9999&#34;,错误的代码?

的情况下检测EOF

re2c似乎有时无法成功检测到EOF。

1 个答案:

答案 0 :(得分:1)

所有看起来合乎逻辑。只是终止测试是不对的。回想一下,限制被设置为超过有效字符的第一个地址,正如re2c手册页所说的那样。

-        if (aLexer->mCursor > aLexer->mLimit)           \
+        if (aLexer->mCursor >= aLexer->mLimit)           \

通过这一行改变,我得到了我认为你期望的结果。

Token = 1(3) [255]
Token = 2(1) [.]
Token = 1(3) [255]
Token = 2(1) [.]
Token = 1(3) [255]
Token = 2(1) [.]