令人费解的正则表达式匹配古怪

时间:2012-04-25 19:56:46

标签: javascript regex

var creatingidmatch='website.com'.match(/.idv.tw|.firm.in|.gen.in|.nom.es|.nom.co|.me.uk|.net.ag|.net.br|.net.bz|.net.co|.net.in|.net.nz|.com.ag|.com.br|.com.bz|.com.co|.com.es|.com.mx|.com.tw|.org.ag|.org.tw|.org.in|.org.uk|.org.nz|.org.es|.co.in|.co.uk|.co.nz|.asia|.mobi|.info|.com|.org|.net|.jobs|.biz|.xxx|.ca|.mx|.tv|.ws|.ag|.am|.at|.be|.bz|.cc|.de|.es|.eu|.fm|.fr|.gs|.in|.it|.jp|.ms|.nl|.nu|.se|.tc|.tk|.tw|.vg|.me|.co|.us/gi);
alert(creatingidmatch);

返回

sit,.com

'sit'来自哪里? (或者更确切地说,为什么它会返回我的字符串中的'sit'部分?)

4 个答案:

答案 0 :(得分:5)

'坐'匹配'。''因为'。'匹配任何角色。

答案 1 :(得分:5)

sit部分来自正则表达式的这一部分:.it。正则表达式中的.匹配任何内容(换行符除外)。因此,.匹配sit匹配以下it。你需要逃避。如果你想让它匹配一个。字面

\.it

由于|之后的每个项目都以.开头,您可以通过首先匹配后跟所有后缀来简化正则表达式。这是更新的正则表达式

/\.(idv\.tw|firm\.in|gen\.in|nom\.es|nom\.co|me\.uk|net\.ag|net\.br|net\.bz|net\.co|net\.in|net\.nz|com\.ag|com\.br|com\.bz|com\.co|com\.es|com\.mx|com\.tw|org\.ag|org\.tw|org\.in|org\.uk|org\.nz|org\.es|co\.in|co\.uk|co\.nz|asia|mobi|info|com|org|net|jobs|biz|xxx|ca|mx|tv|ws|ag|am|at|be|bz|cc|de|es|eu|fm|fr|gs|in|it|jp|ms|nl|nu|se|tc|tk|tw|vg|me|co|us)/gi;

答案 2 :(得分:1)

这样做:

var creatingidmatch = 'website.com'.match(/\.idv\.tw|\.firm\.in| ...

答案 3 :(得分:1)

''。'字符表示匹配任何非换行符。

'sit'匹配“.it”条件。

你需要逃避所有'。的