正则表达式剥离html标签添加一个额外的字符

时间:2014-02-25 13:01:40

标签: jquery regex

我有一个奇怪的情况,我正在使用正则表达式从我的文本中删除HTML标记

我有以下文字:

<div align="center">​test_gautam</div>

应用以下正则表达式

var regex = /(<[^>]*>)/ig;
var CommentText = editor.getValue().replace(regex, "");

给我

"​test_gautam"

这看起来不错,但仔细检查后我发现第一个引号和t之间有一个看不见的字符。 由于这个原因,我的其他正则表达式失败了。 有没有人知道如何摆脱这个看不见的角色?

检查隐形字符复制以下文字并粘贴在记事本中

"​test_gautam"

1 个答案:

答案 0 :(得分:2)

var regex = /(<[^>]*>)[^a-zA-Z0-9]*/ig;

应该抓住任何不是字母/数字的东西,并且在<

之后