使用扩展查找和替换+注册表达式在HTML中查找和删除锚标记

时间:2014-07-16 20:24:02

标签: html

我尝试使用正则表达式来查找和删除与这些相同的所有锚标记 -

<a href="mms://media.domain.com/CHE/filename-1.wma">title name</a>  
<a href="mms://media.domain.com/CHE/filename.wma">title name part II</a>

只有文件名和标题发生变化,我需要将标题(取消链接)留在后面。

由于我的文字处理背景,我在我的扩展查找中天真地尝试了以下通配符,并用检查的正则表达式替换:

<a href="mms://media.domain.com/CHE/*.wma">*</a>    

它当然不起作用,甚至不删除整个链接和文本。

经过大量的搜索和阅读,我仍在猜测如何做到这一点。因为没有找到的例子我使用扩展查找和替换正是我所需要的。所有这一切都在我的头上。

我搜索了#34;如何在搜索和替换中使用正则表达式&#34;使用HomeSite,Dreamweaver,topsite和其他类似的软件来编辑我的HTML文档。没有成功。我已经阅读了几个关于使用RegExp和我学习的教程,但似乎仍然无法满足我的需求。我已经阅读了如何在php,perl,c ++中使用RegExp,但无法将其转换为我需要的内容。

我愿意使用其他文字编辑软件来完成此操作,因为我需要删除大约4,000个这些wma文件链接,同时保持标题和其他标签不受影响。

我在stackoverflow上搜索过类似的问题。并且阅读一般使用正则表达式,但我不能按照足够的解释来使其适应我的需要。这是一个很大的主题。

这是我到目前为止所做的:

<a href="mms:\/\/media\.domain\.com\/CME\/           \.wma">       <\/a>  

我留下空格的部分是给我带来麻烦的。

由于

1 个答案:

答案 0 :(得分:0)

在论坛上有一些帮助我能够找到答案,这里是

查找

<a href="mms:\/\/media\.domain\.com\/WMA\/[^.]+.wma">([^<]+)</a>

替换:

\1   

注意[^&lt;] +周围的括号,这会创建一个可以被\引用的子表达式。我不知道这一切是如何完全正常的,但我在一篇文章中找到了它。

此查找和替换查找我的锚标记和标题,并将其替换为标题 我必须感谢http://forums.devshed.com我遗失的作品。