我发现这个功能可以清除MS Word标记:
$html = ereg_replace("<(/)?(font|span|del|ins)[^>]*>","",$html);
$html = ereg_replace("<([^>]*)(class|lang|style|size|face)=(\"[^\"]*\"|'[^']*'|[^>]+)([^>]*)>","<\\1>",$html);
$html = ereg_replace("<([^>]*)(class|lang|style|size|face)=(\"[^\"]*\"|'[^']*'|[^>]+)([^>]*)>","<\\1>",$html);
它工作正常。但是,我想用preg_replace替换ereg_replace(不建议使用)。当我这样做(带/分隔符)时,该功能不再起作用。
我很少理解正则表达式,我担心...... 这里的一些巫师可以帮我这个吗?非常感谢!!
答案 0 :(得分:2)
尝试使用#
作为分隔符,例如:
$html = preg_replace("#<(/)?(font|span|del|ins)[^>]*>#","",$html);