如何从html innertext中替换电子邮件地址

时间:2014-12-02 06:58:43

标签: php regex preg-replace

我有一个问题,就是从html innertext替换电子邮件地址。

我可以替换所有电子邮件地址。但我不能只替换特定的(HTML的innertext)。请帮帮我..

我尝试了preg_replace('/[A-Z0-9._%+-]+@([A-Z0-9.-]+\.[A-Z]{2,4}|[A-Z0-9.-]+)/iu','[---]',$data)

请帮帮我。感谢...

我的输入

<div  data="example1@dom.com,example4@dom.com"><a href="example1@dom.com" > example4@dom.com,  <b>example3@dom.com</b>  other text, example7@dom.com, ,<i>example5@dom.com</i></a></div >

预期产出:

<div  data="example1@dom.com,example4@dom.com"><a href="example1@dom.com" > [--],  <b>[--]</b>  other text, [--] ,<i>[--]</i></a></div >

live demo

2 个答案:

答案 0 :(得分:1)

[A-Z0-9._%+-]+@([A-Z0-9.-]+\.[A-Z]{2,4}(?![^<]*>)|[A-Z0-9.-]+)(?![^<]*>)

试试这个。看看演示。

http://regex101.com/r/yR3mM3/6

$re = "/[A-Z0-9._%+-]+@([A-Z0-9.-]+\\.[A-Z]{2,4}(?![^<]*>)|[A-Z0-9.-]+)(?![^<]*>)/mi";
$str = "<div data=\"example1@dom.com,example4@dom.com\"><a href=\"example1@dom.com\" > example4@dom.com, <b>example3@dom.com</b> other text, example7@dom.com, ,<i>example5@dom.com</i></a></div >";
$subst = "[---]";

$result = preg_replace($re, $subst, $str);

输出:<div data="example1@dom.com,example4@dom.com"><a href="example1@dom.com" > [---], <b>[---]</b> other text, [---], ,<i>[---]</i></a></div >

答案 1 :(得分:1)

通过PCRE动词(*SKIP)(*F)

<[^<>]*>(*SKIP)(*F)|[A-Z0-9._%+-]+@([A-Z0-9.-]+\.[A-Z]{2,4}|[A-Z0-9.-]+)

DEMO

<[^<>]*>匹配所有标记,以下PCRE动词(*SKIP)(*F)使匹配完全失败。然后正则表达式引擎尝试将|符号右侧的模式与剩余的字符串进行匹配。

$re = "/<[^<>]*>(*SKIP)(*F)|[A-Z0-9._%+-]+@([A-Z0-9.-]+\\.[A-Z]{2,4}|[A-Z0-9.-]+)/mi";
$str = "<div data=\"example1@dom.com,example4@dom.com\"><a href=\"example1@dom.com\" > example4@dom.com, <b>example3@dom.com</b> other text, example7@dom.com, ,<i>example5@dom.com</i></a></div >\n";
$subst = "[---]";
$result = preg_replace($re, $subst, $str);
echo $result;

<强>输出:

<div data="example1@dom.com,example4@dom.com"><a href="example1@dom.com" > [---], <b>[---]</b> other text, [---], ,<i>[---]</i></a></div >