坚持使用javascript正则表达式分组

时间:2012-09-10 19:13:54

标签: javascript regex

我有五个不同的正则表达式和公共部分。最后?的所有部分都是可选的,但订单必须保持不变。 title1 - title6是正则表达式彼此不同的地方。

如何对这些进行分组以消除公共部分的重复?

伪代码如下:

title1       type? column option?
title2 name? type? column option?
title3 name? type? column option?
title4 name?       column option?
title5 name?       column other

到目前为止我所拥有的是:

(title1 type?|(title2|title3) name? type?|(title4|title5) name?) column option?

除了重复之外,我无法弄清楚为最后一个正则表达式添加other部分的最佳方式是什么。

修改

由于我必须从中提取的变量数量,我决定坚持我的初步计划将所有正则表达式分开。 万一有人好奇我的解决方案是什么:

var blocks = {
  name1: /regex1/,
  name2: /regex2/,
  name3: /regex3/,
  ...
};

var regex = [
  createRegex(['name1', 'name2', 'name3', ...]),
  createRegex(['name1', 'name3', 'name4', ...]),
  ...
];

function createRegex = function (params) {
  var regex = '';
  for (var i=0; i < params.length; i++) {
    var name = params[i];
    regex += blocks[name].source;
  }
  return new RegExp(regex, 'i');
}

这是我初始化正则表达式列表的方式,它不是伪代码(正则表达式及其名称除外)。

2 个答案:

答案 0 :(得分:1)

这可能不是您要搜索的确切解决方案。但您可以编写如下所示的函数来实现您的需求

function getRegExp() {
    var regExp = "";
    for (var i = 0; i < arguments.length; i++) {
        if (arguments[i]) {
            if (typeof(arguments[i]) == "string") {
                regExp += "(" + arguments[i] + ")";
            } else if (arguments[i].length) {
                regExp += "(" + arguments[i].join("|") + ")";
            }
        }
    }
    return new RegExp(regExp);
}

var regExp = getRegExp(["title1", "title2", "title3", "title4", "title5"], " ", "name?", " ", "type?", " ", "column", " ", ["option?", "other"]);
console.log(regExp);
regExp.test("title1 name type column option");

答案 1 :(得分:0)

我会使用这个表达式,只有少数表达式有共同的部分。

^((title1\s+(type\s)?column(\soption)?)|((title2|title3) (name\s)?(type\s)?column(\soption)?)|(title4(\sname)?\s+column(\soption)?)|(title5(\sname)?\s+column other))$