我职位的最后一个人是标题标签中的逗号。我需要删除40,000个html产品页面的标题标签中的所有逗号。是否有正则表达式来查找标题标记中的所有逗号?我希望我能用正则表达式找到所有逗号并在Dreamweaver中替换它们。这可能吗?
格式通常如下
(打开标题标签)产品,产品,81120,
(打开标题标签)产品,产品,98564,
(开头标题标签)产品,产品,98564,
(打开标题标签)产品,产品,98564,
最后的数字是5位数的产品#
非常感谢任何帮助
答案 0 :(得分:2)
您可以在逗号后面的第一个</title>
后面找到<
之后的逗号,并用空字符串替换它们:
,(?=[^<]*</title>)
请注意,这假设您将在编辑器中执行此操作。当谈到未知的HTML时,永远不要相信正则表达式。如果您将在代码中使用它,最好使用DOM解析器来正确定位替换。它还假定字符串</title>
不会出现在上下文之外(例如在javascript代码中),或者您可以手动查看替换过程,只要这个正则表达式可能会混淆。 (他的想法是再次拥有40k HTML文件?希望他们不会创建新的标题标签!)。
答案 1 :(得分:1)
描述如何在PHP中执行此操作的好博客:http://www.thatsquality.com/articles/how-to-match-and-replace-content-between-two-html-tags-using-regular-expressions
我认为在Dreamweaver中你会想要使用后引用的东西:
(<Title>\S\s),+(\S\s<\/Title>)
在替换中使用此: $ 1 $ 2
正如所指出的那样 - 需要将其循环到成功 - 认为这是IDE会支持的东西,但情况可能并非如此。
这里的好帖子:http://somerandomdude.com/2006/05/25/dreamweaver-regular-expressions/
答案 2 :(得分:-3)
你可以用它
正则表达式:([\,]+)