我正在研究java世界中的词法分析,并希望将给定的字符串分解为丢弃空格的标记。我使用下面的正则表达式匹配令牌,如字母,数字和最常见的运算符和分隔符:
"[a-zA-Z0-9_]+|[\\[\\](){}.;,!<>+^%]"
但是,++
,--
,==
,<=
,>=
^=
,*=
,{{等运营商1}}很难处理。有关如何提高我的正则表达式以满足我的需求的任何帮助?非常感谢。
答案 0 :(得分:0)
试试这个:
"[a-zA-Z0-9_]|\+\+|--|<<|>>|[=+<>^*]=|[\[\](){}.;,!<>+^%]"
说明:
\+\+
抓住++
--
抓住--
<<
抓住<<
>>
抓住>>
[=+<>^*]=
抓住==
,<=
,>=
,^=
,*=
,+=