Question

论坛成员，

我正在使用NotePad ++并且在其他文本数据中嵌入了一堆CAUTIONS。将“小心”数据与其余文本数据区分开来的两个常量是两个因素。一个是小心文本始终为大写文本，第二个小心文本始终以大写字母“小心”开头。以下是我所描述的一个小例子：

Bla bla bla bla bla。小心不要在没有首先阅读用户手册的情况下对机器进行维护。 Bla bla bla bla bla bla。

RegEx是否有可能找到以下文本的许多不同变体：

小心不要在没有首先阅读用户手册的情况下对机器进行维护。

然后用以下内容替换它：

 <caution><para>DO NOT PERFORM MAINTENANCE ON MACHINE WITHOUT FIRST READING THE OWNER'S MANUAL.</para></caution>

我需要帮助编写执行以下操作的RegEx：

这样的RegEx可能吗？世界上如何使RegEx足够聪明，只根据我所描述的内容找到与注意相关的文本？任何信息将不胜感激。提前谢谢。

Answer 1

我没有专门的pad ++，所以尽管他们的正则表达式实现有任何怪癖，但这似乎可以解决问题：

CAUTION ([A-Z](([^a-z])+\s+)+)

替换

<caution><para>$1</caution></para>

请在此处查看：