我需要使用reg表达式来查找中文的英文文本并为其添加一个类。
实施例: 输入
<p>当然,你要学习<a href='#' target='_blank'>“<b>Megento</b>”</a></p>
输出应该是:
<p>当然,你要学习<a href='#' target='_blank'>“<b><span class="english">Megento</span></b>”</a></p>
答案 0 :(得分:0)
.NET正则表达式可以基于Unicode字符范围进行匹配(请参阅 Unicode Category or Unicode Block: \p{}
)。例如,正则表达式\p{IsBasicLatin}
将匹配x
,但不匹配Ǝ
(U + 018E:拉丁大写字母反转E)。
因此,使用它来匹配元素的文本内容是非常有可能的。
But don't use regex to parse the HTML itself。使用HTML解析器处理HTML,然后使用正则表达式查看文本内容。