正则表达式:匹配列表中的所有单词,忽略特殊字符

时间:2018-05-16 21:19:58

标签: javascript regex

我正在尝试使用正则表达式突出显示大量文本中的特定段落。问题是我需要突出显示的文本中删除了一些特殊字符,因此我在编写正则表达式以查找正文中的匹配时遇到问题。我开始从我需要找到的字符串中拉出所有单词,如下所示:

  • 起始字符串:“您好,这是我的搜索字符串”
  • 结果字符串:“你好,这是我的搜索字符串”

我现在正在尝试匹配正文中的结果字符串,但由于正文仍然有一些特殊字符(我无法删除以用于显示目的)我正在使用正则表达式。

  • 身体:“这是身体,你可以在那里找到很多特殊字符。你好,”这是我没有正确标点符号的搜索字符串。“

我该如何匹配这句话? 您好这是我的搜索字符串并忽略正文中的额外字符吗?

1 个答案:

答案 0 :(得分:0)

试试这个[^\w\d\s] - 这里是example

您可以使用以下code来查找"空间字符的索引" (正如你在下面的评论中所描述的那样"任何不是数字或字母" 的东西,我猜这个"空间"也不特别)出现:

let str = 'Body: "This is the body, where you can find lots of special characters. Hello, "this" is my search string without the correct punctdsuation."'

let re = /[^\w\d\s]/g;

while ((match = re.exec(str)) != null) 
{
    console.log("match found at " + match.index);
}

这是有效的EXAMPLE