RegEx在HTML

时间:2015-05-09 20:15:13

标签: html regex hardcoded

我需要一些帮助来从HTML中提取硬编码字符串。

这是我使用的模板引擎的示例标记

[[if:"x";"y"]]
    <p>true part</p>
[[:else]]
    <p>false part</p>
[[:endif]]

[[each:ARRAY;KEY;VALUE]]
    Index :[[KEY]] is :[[VALUE]]

    or if VALUE is an array
    Index :[[KEY]], FOO is :[[VALUE:FOO]]
[[:endeach]]

{$_TEMPLATE['VARS']}

<p><b>I want this</b> and this, {%'AND **THIS NOT**, THIS IS ALREADY TRANSLATED
SINGLE QUOTE MARK IS ESCAPED BY A BACKSLASH \' '}
LINES</p>

目前我使用的是/>([^\<\>\n\{\}]+\S*?)+</is模式,但它不可靠。

不应提取

:[[VAR]]{$_TEMPLATE['VAR']}和控制块([[if:"x";"y"]]等)。如果是混合文字(Foo :[[has]]栏),应Foobar单独提取

对于属性,我使用的模式/(placeholder|title|alt|value)\=\"([^\"\'=\{\}\[\]]*?)\"/没有问题

我希望你能帮助我。

编辑:此示例的必需输出:

true part
false part
Index 
is
or if VALUE is an array
Index
, FOO is
I want this
and this

0 个答案:

没有答案