我正在尝试搜索并替换大量文件,我需要格式化以下HTML。
<a href="http://www.XXXXXXXXX.com target=_blank">
<img alt="XXXXXXXXX" src=http://domain.org/files/image.gif" />
</a>
我需要XXXXXXX部件的正则表达式。基本上找到所用域的所有组合以及所用alt字的所有组合。
有些域中有1 -
(短划线),其他域中有2 -
(破折号),而其他域则没有。一些alt图像是2个单词,而其他图像是3.域或alt标签中没有数字。
非常感谢任何帮助。
答案 0 :(得分:2)
替换:
a href="http://www\..+\.com\ +target
与
a href="http://www.NEWVALUE.com target
替换:
img alt="[^"]+"\ +src=
与
img alt="NEWVALUE" src=