为什么我的正则表达式捕获组仅在匹配多个部分时捕获字符串的最后部分?

时间:2014-11-24 18:42:19

标签: javascript regex quantifiers capture-group

我尝试了什么

var test = "asdfdas ABCD EFGH";
var regex = /^\S+( [A-Z]{4})+$/; 
    // Also tried: /^\S+( [A-Z]{4})+$/g
    // And: /^\S+( [A-Z]{4})+?$/g
var matches = test.match(regex);

我做了JSFiddle

我的期待

变量matches应该成为这个数组:

[
  "asdfdas ABCD EFGH",
  " ABCD",
  " EFGH"
]

我得到什么

变量matches实际上就是这个数组:

[
  "asdfdas ABCD EFGH",
  " EFGH"
]

我的想法

我的猜测是我在捕获组和/或$逻辑中缺少了一些东西。任何帮助,将不胜感激。 (我知道我可以弄清楚如何在多个正则表达式中执行此操作,但我想了解这里发生了什么。)

1 个答案:

答案 0 :(得分:3)

是的,这正是它的作用;你没有做错任何事。当一个组被赋予量词时,它只捕获它的最后一个匹配,这就是它在JavaScript中所做的一切。一般的解决方法是使用多个正则表达式,如你所说,例如

var test = "asdfdas ABCD EFGH";
var match = test.match(/^\S+((?: [A-Z]{4})+)$/); // capture all repetitions
var matches = match[1].match(/ [A-Z]{4}/g); // match again to get individual ones