我正在使用Flex和Bison编写解析器,并将各种标记定义为:
[0-9]+ { yylval.str=strdup(yytext); return digit; }
[0-9]+\.[0-9]* { yylval.str=strdup(yytext); return floating; }
[a-zA-Z_][a-zA-Z0-9_]* { yylval.str=strdup(yytext); return key; }
[a-zA-Z/][a-zA-Z_-/.]* { yylval.str=strdup(yytext); return string; }
[a-zA-Z0-9._-]+ { yylval.str=strdup(yytext); return hostname; }
["][a-zA-Z0-9!@#$%^&*()_-+=.,/?]* { yylval.str=strdup(yytext); return qstring1; }
[a-zA-Z0-9!@#$%^&*()_-+=.,/?]*["] { yylval.str=strdup(yytext); return qstring2; }
[#].+ { yylval.str=strdup(yytext); return comment;}
[ \n\t] {} /* Ignore white space. */
. {printf("ERR:L:%d\n", q); return ERROR;}
它在字符串,qstring1和qstring2的正则表达式中显示错误“字符类中的负范围”。
有人可以帮助我解决我出错的地方吗?
规范是这样的: 非引用字符串可能包含ASCII字母数字字符,下划线,连字符,正斜杠和句点,并且必须以字母或斜杠开头。
带引号的字符串可以在引号之间包含任何字母数字字符。
我为引用的字符串选择了两个不同的字符串,以满足更多规范。
感谢。
答案 0 :(得分:3)
对于(string
,qstring1
,qstring2
),您需要将连字符(-
)设置为第一个或字符类[]
的最后字符,或者只是在其他地方转义\-
。
(字符串)
[a-zA-Z/][a-zA-Z_./-]*
(qstring1)
["][a-zA-Z0-9!@#$%^&*()_+=.,/?-]*
(qstring2)
[a-zA-Z0-9!@#$%^&*()_+=.,/?-]*["]
答案 1 :(得分:2)
-
需要使用反斜杠进行转义。
对于qstring1,请尝试以下操作:
["][a-zA-Z0-9!@#$%^&*()_\-+=.,/?]*
答案 2 :(得分:0)
我猜在编写正则表达式时,应该始终按照优先级顺序来编写它:
例如这行代码:
[+-/*><=] {printf("Operator %c\n",yytext[0]); return yytext[0];}
不会出现任何错误。
而:
[+-*/><=] {printf("Operator %c\n",yytext[0]); return yytext[0];}
将。
希望对您有帮助。