清理文本,从全部大写到<em>全部大写</em>

时间:2012-02-25 08:04:53

标签: regex notepad++

我需要为使用ALLCAPS而不是斜体的html清理一些文本。所以我想采取看起来像这样的东西:

Here is an artificial EXAMPLE of a piece of TEXT that
uses allcaps as a way of EMPHASIZING words.

并将其转换为:

Here is an artificial <em>example</em> of a piece of <em>text</em> that
uses allcaps as a way of <em>emphasizing</em> words.

我用正则表达式和记事本++标记这个,但是(你可以告诉我)我不知道如何使用它们的第一件事。对于像我这样的新手的任何替代技术也将非常感激。

1 个答案:

答案 0 :(得分:1)

您可以使用此正则表达式实现此目的:

([A-Z][A-Z']+)

这将匹配包含标点符号的大写字母,例如DON'T等字词。

注意:这与非ASCII字母不匹配。


要在Notepad ++中使用它:

单击CTRL + H进入“替换”对话框,然后输入:

  • 找到:([A-Z][A-Z']+)
  • 替换为:<em>\1</em>
  • 匹配案例:已检查
  • 搜索模式:正则表达式

首先尝试“查找下一个”以查看表达式是否符合您的预期。