我有一个问题,就是从html innertext替换电子邮件地址。
我可以替换所有电子邮件地址。但我不能只替换特定的(HTML的innertext)。请帮帮我..
我尝试了preg_replace('/[A-Z0-9._%+-]+@([A-Z0-9.-]+\.[A-Z]{2,4}|[A-Z0-9.-]+)/iu','[---]',$data)
请帮帮我。感谢...
我的输入
<div data="example1@dom.com,example4@dom.com"><a href="example1@dom.com" > example4@dom.com, <b>example3@dom.com</b> other text, example7@dom.com, ,<i>example5@dom.com</i></a></div >
预期产出:
<div data="example1@dom.com,example4@dom.com"><a href="example1@dom.com" > [--], <b>[--]</b> other text, [--] ,<i>[--]</i></a></div >
答案 0 :(得分:1)
[A-Z0-9._%+-]+@([A-Z0-9.-]+\.[A-Z]{2,4}(?![^<]*>)|[A-Z0-9.-]+)(?![^<]*>)
试试这个。看看演示。
http://regex101.com/r/yR3mM3/6
$re = "/[A-Z0-9._%+-]+@([A-Z0-9.-]+\\.[A-Z]{2,4}(?![^<]*>)|[A-Z0-9.-]+)(?![^<]*>)/mi";
$str = "<div data=\"example1@dom.com,example4@dom.com\"><a href=\"example1@dom.com\" > example4@dom.com, <b>example3@dom.com</b> other text, example7@dom.com, ,<i>example5@dom.com</i></a></div >";
$subst = "[---]";
$result = preg_replace($re, $subst, $str);
输出:<div data="example1@dom.com,example4@dom.com"><a href="example1@dom.com" > [---], <b>[---]</b> other text, [---], ,<i>[---]</i></a></div >
答案 1 :(得分:1)
通过PCRE动词(*SKIP)(*F)
。
<[^<>]*>(*SKIP)(*F)|[A-Z0-9._%+-]+@([A-Z0-9.-]+\.[A-Z]{2,4}|[A-Z0-9.-]+)
<[^<>]*>
匹配所有标记,以下PCRE动词(*SKIP)(*F)
使匹配完全失败。然后正则表达式引擎尝试将|
符号右侧的模式与剩余的字符串进行匹配。
$re = "/<[^<>]*>(*SKIP)(*F)|[A-Z0-9._%+-]+@([A-Z0-9.-]+\\.[A-Z]{2,4}|[A-Z0-9.-]+)/mi";
$str = "<div data=\"example1@dom.com,example4@dom.com\"><a href=\"example1@dom.com\" > example4@dom.com, <b>example3@dom.com</b> other text, example7@dom.com, ,<i>example5@dom.com</i></a></div >\n";
$subst = "[---]";
$result = preg_replace($re, $subst, $str);
echo $result;
<强>输出:强>
<div data="example1@dom.com,example4@dom.com"><a href="example1@dom.com" > [---], <b>[---]</b> other text, [---], ,<i>[---]</i></a></div >