删除<title>标记</title>中的所有逗号

时间:2013-01-23 21:57:09

标签: html regex replace find dreamweaver

我职位的最后一个人是标题标签中的逗号。我需要删除40,000个html产品页面的标​​题标签中的所有逗号。是否有正则表达式来查找标题标记中的所有逗号?我希望我能用正则表达式找到所有逗号并在Dreamweaver中替换它们。这可能吗?

格式通常如下

(打开标题标签)产品,产品,81120,
(打开标题标签)产品,产品,98564,
(开头标题标签)产品,产品,98564,
(打开标题标签)产品,产品,98564,

最后的数字是5位数的产品#

非常感谢任何帮助

3 个答案:

答案 0 :(得分:2)

您可以在逗号后面的第一个</title>后面找到<之后的逗号,并用空字符串替换它们:

,(?=[^<]*</title>)

请注意,这假设您将在编辑器中执行此操作。当谈到未知的HTML时,永远不要相信正则表达式。如果您将在代码中使用它,最好使用DOM解析器来正确定位替换。它还假定字符串</title>不会出现在上下文之外(例如在javascript代码中),或者您可以手动查看替换过程,只要这个正则表达式可能会混淆。 (他的想法是再次拥有40k HTML文件?希望他们不会创建新的标题标签!)。

答案 1 :(得分:1)

描述如何在PHP中执行此操作的好博客:http://www.thatsquality.com/articles/how-to-match-and-replace-content-between-two-html-tags-using-regular-expressions

我认为在Dreamweaver中你会想要使用后引用的东西:

(<Title>\S\s),+(\S\s<\/Title>)

在替换中使用此: $ 1 $ 2

正如所指出的那样 - 需要将其循环到成功 - 认为这是IDE会支持的东西,但情况可能并非如此。

这里的好帖子:http://somerandomdude.com/2006/05/25/dreamweaver-regular-expressions/

答案 2 :(得分:-3)

你可以用它 正则表达式:([\,]+)