需要正则表达式来查找中文英语单词

时间:2013-09-05 08:39:48

标签: c# java php javascript regex

我需要使用reg表达式来查找中文的英文文本并为其添加一个类。

实施例: 输入

<p>当然,你要学习<a href='#' target='_blank'>“<b>Megento</b>”</a></p>

输出应该是:

<p>当然,你要学习<a href='#' target='_blank'>“<b><span class="english">Megento</span></b>”</a></p>

1 个答案:

答案 0 :(得分:0)

.NET正则表达式可以基于Unicode字符范围进行匹配(请参阅 Unicode Category or Unicode Block: \p{} )。例如,正则表达式\p{IsBasicLatin}将匹配x,但不匹配Ǝ(U + 018E:拉丁大写字母反转E)。

因此,使用它来匹配元素的文本内容是非常有可能的。

But don't use regex to parse the HTML itself。使用HTML解析器处理HTML,然后使用正则表达式查看文本内容。