我有五个不同的正则表达式和公共部分。最后?
的所有部分都是可选的,但订单必须保持不变。 title1
- title6
是正则表达式彼此不同的地方。
如何对这些进行分组以消除公共部分的重复?
伪代码如下:
title1 type? column option?
title2 name? type? column option?
title3 name? type? column option?
title4 name? column option?
title5 name? column other
到目前为止我所拥有的是:
(title1 type?|(title2|title3) name? type?|(title4|title5) name?) column option?
除了重复之外,我无法弄清楚为最后一个正则表达式添加other
部分的最佳方式是什么。
由于我必须从中提取的变量数量,我决定坚持我的初步计划将所有正则表达式分开。 万一有人好奇我的解决方案是什么:
var blocks = {
name1: /regex1/,
name2: /regex2/,
name3: /regex3/,
...
};
var regex = [
createRegex(['name1', 'name2', 'name3', ...]),
createRegex(['name1', 'name3', 'name4', ...]),
...
];
function createRegex = function (params) {
var regex = '';
for (var i=0; i < params.length; i++) {
var name = params[i];
regex += blocks[name].source;
}
return new RegExp(regex, 'i');
}
这是我初始化正则表达式列表的方式,它不是伪代码(正则表达式及其名称除外)。
答案 0 :(得分:1)
这可能不是您要搜索的确切解决方案。但您可以编写如下所示的函数来实现您的需求
function getRegExp() {
var regExp = "";
for (var i = 0; i < arguments.length; i++) {
if (arguments[i]) {
if (typeof(arguments[i]) == "string") {
regExp += "(" + arguments[i] + ")";
} else if (arguments[i].length) {
regExp += "(" + arguments[i].join("|") + ")";
}
}
}
return new RegExp(regExp);
}
var regExp = getRegExp(["title1", "title2", "title3", "title4", "title5"], " ", "name?", " ", "type?", " ", "column", " ", ["option?", "other"]);
console.log(regExp);
regExp.test("title1 name type column option");
答案 1 :(得分:0)
我会使用这个表达式,只有少数表达式有共同的部分。
^((title1\s+(type\s)?column(\soption)?)|((title2|title3) (name\s)?(type\s)?column(\soption)?)|(title4(\sname)?\s+column(\soption)?)|(title5(\sname)?\s+column other))$