正则表达式模式匹配LEX实用程序中的html标记?

时间:2013-10-14 20:17:04

标签: regex lex

我是Lex的新手。 我想编写一个lex程序来从文件中提取所有html标签。 我尝试了几个模板来匹配标签,但都无法正常工作。

我试过

"<"[^>]*> /*The quotes because lex utility gives error that improper start of expression*/
"<"[a-z]+[/]*>

还有更多...但是当我执行像

这样的行时
<h1> This is a heading </h1>

在他们身上,并尝试用yytext打印它,它只是打印完整的代码行而不是打印

<h1></h1>

任何解决方案?

1 个答案:

答案 0 :(得分:1)

我得到了答案。 我正在做的是,对其余无法比拟的文本没有任何动作。 我把lex程序的规则部分改为:

"<"[^>]*> { /* action for tags */ }
.|\n     ;

那就是那个。现在它打印出所需的输出。