我需要为使用ALLCAPS而不是斜体的html清理一些文本。所以我想采取看起来像这样的东西:
Here is an artificial EXAMPLE of a piece of TEXT that
uses allcaps as a way of EMPHASIZING words.
并将其转换为:
Here is an artificial <em>example</em> of a piece of <em>text</em> that
uses allcaps as a way of <em>emphasizing</em> words.
我用正则表达式和记事本++标记这个,但是(你可以告诉我)我不知道如何使用它们的第一件事。对于像我这样的新手的任何替代技术也将非常感激。
答案 0 :(得分:1)
您可以使用此正则表达式实现此目的:
([A-Z][A-Z']+)
这将匹配包含标点符号的大写字母,例如DON'T
等字词。
注意:这与非ASCII字母不匹配。
要在Notepad ++中使用它:
单击CTRL + H进入“替换”对话框,然后输入:
([A-Z][A-Z']+)
<em>\1</em>
首先尝试“查找下一个”以查看表达式是否符合您的预期。