flex和bison:字符串文字

时间:2012-12-24 22:25:37

标签: c++ string bison flex-lexer

我需要你的建议如何获得字符串文字。字符串文字是以b"开头的所有内容,后面有零个或多个符号,以"结尾。令牌称为BYTES_OBJECTbytes_type是存储此类字符串文字的类型名称。 这是我尝试过的:

{%
#include "parser.hpp"
#include <iostream>
#include <string>
string BUFFER;
%}

%option noyywrap
%x COMMENT
%x BYTESMODE

"b"[\"] {
  BUFFER = string();
  BEGIN BYTESMODE;
} // BYTESMODE

  <BYTESMODE>{BYTES_HEXCODE} {
    // convert to hexcode
  } // BYTES_HEXCODE

  <BYTESMODE>{BYTES_ESCAPE} {
    yytext++; // Move to the next char
    switch (*yytext) {
      case '\'': BUFFER += '\''; break;
      case '\"': BUFFER += '\"'; break;
      case '\\': BUFFER += '\\'; break;
      case '\?': BUFFER += '?';  break;
      case 'a':  BUFFER += '\a'; break;
      case 'b':  BUFFER += '\b'; break;
      case 'f':  BUFFER += '\f'; break;
      case 'n':  BUFFER += '\n'; break;
      case 'r':  BUFFER += '\r'; break;
      case 't':  BUFFER += '\t'; break;
      case 'v':  BUFFER += '\v'; break;
    } // end of switch
  } // BYTES_ESCAPE

  <BYTESMODE>[^\"] {
    BUFFER += yytext;
  } // BYTES_SYMBOL

  <BYTESMODE>\" {
    bytes_type object = BUFFER;
    yylval.bytes_buffer = &object;
    BEGIN INITIAL;
    return BYTES_OBJECT;
  } // closing quote

但是,当我尝试创建字符串时,会导致段错误。如果return BYTES_OBJECTBEGIN INITIAL之前,则处理文字不正确。我该如何解决?我想即使是概念也可以比我写的更容易。

提前致谢!

1 个答案:

答案 0 :(得分:1)

您的输入文件有一些错误。你不应该只是为了识别字符串而进行这样详细的处理。一个更简单的例子:

%option noyywrap
%{
#include <iostream>
#include <string>
%}

%%
b\"(\\.|[^\\"])*\" { 
  std::cout << "string:" << yytext << std::endl;
  return(1); 
}

%%

int main() {
  yylex();
  return 0;
}