从HTML

时间:2015-11-13 14:22:33

标签: php html regex xml

我正在尝试使用HTML页面中的条件语句删除条件注释语句和任何XML内容,我使用下面的PHP但它似乎没有删除条件语句和XML内容,正则表达式语句有效!?

HTML

...
<link rel=File-List href="filelist.xml">
<!--[if gte mso 9]><xml>
 <o:DocumentProperties>
  <o:Revision>3</o:Revision>
  <o:TotalTime>1</o:TotalTime>
  <o:Created>2014-02-14T21:30:00Z</o:Created>
  <o:LastSaved>2014-02-14T21:35:00Z</o:LastSaved>
  <o:Pages>1</o:Pages>
  <o:Words>58</o:Words>
  <o:Characters>331</o:Characters>
  <o:Lines>2</o:Lines>
  <o:Paragraphs>1</o:Paragraphs>
  <o:CharactersWithSpaces>388</o:CharactersWithSpaces>
  <o:Version>15.00</o:Version>
 </o:DocumentProperties>
 <o:OfficeDocumentSettings>
  <o:AllowPNG/>
 </o:OfficeDocumentSettings>
</xml><![endif]-->
<link rel=themeData href="themedata.tx">
...

PHP

$html = preg_replace('/<\?xml[^>]+\/>/im', '', $html);
$html = preg_replace('/<!--\[(.*)\]>/is', '', $html);
$html = preg_replace('/<!\[(.*)\]-->/is', '', $html);

1 个答案:

答案 0 :(得分:0)

尝试此选项以匹配完整的条件评论:

$html = preg_replace('/<!--\[if gte mso 9\]>.*<!\[endif\]-->/s', '', $html);

http://sandbox.onlinephpfunctions.com/code/e8a48984f34f2323ae14d72b7c33d3065edd00dc