Question

我需要使用reg表达式来查找中文的英文文本并为其添加一个类。

实施例：输入

<p>当然，你要学习<a href='#' target='_blank'>“<b>Megento</b>”</a></p>

输出应该是：

<p>当然，你要学习<a href='#' target='_blank'>“<b><span class="english">Megento</span></b>”</a></p>

Answer 1

.NET正则表达式可以基于Unicode字符范围进行匹配（请参阅 Unicode Category or Unicode Block: \p{} ）。例如，正则表达式\p{IsBasicLatin}将匹配x，但不匹配Ǝ（U + 018E：拉丁大写字母反转E）。

因此，使用它来匹配元素的文本内容是非常有可能的。

But don't use regex to parse the HTML itself。使用HTML解析器处理HTML，然后使用正则表达式查看文本内容。