我正在尝试在node.js上使用javascript清理输入字符串。一些输入字符串可能包含我想删除的电话号码(或数字的随机序列)。例如:
输入字符串:Terrace 07541207031 RDL 18.02
清洗后,我希望字符串为:Terrace RDL 18.02
我想检测数字(例如大于4位数字)并将其删除。
答案 0 :(得分:3)
This expression可能与您所需的输入匹配。
(\s)([0-9]{4,})(\s?)
如果您希望匹配任意4位数字和数字,则只需删除左右空格的检查边界:
([0-9]{4,})
const regex = /(\s)([0-9]{4,})(\s?)/gm;
const str = `Terrace 07541207031 RDL 18.02
Terrace 07541 RDL 18.02
Terrace 075adf8989 RDL 18.02
Terrace 075adf898 RDL 18.02
075898 RDL 18.02
Terrace RDL 98989https://regex101.com/r/FjZqaF/1/codegen?language=javascript`;
let m;
while ((m = regex.exec(str)) !== null) {
// This is necessary to avoid infinite loops with zero-width matches
if (m.index === regex.lastIndex) {
regex.lastIndex++;
}
// The result can be accessed through the `m`-variable.
m.forEach((match, groupIndex) => {
console.log(`Found match, group ${groupIndex}: ${match}`);
});
}
此脚本针对表达式返回输入字符串的运行时。
const repeat = 1000000;
const start = Date.now();
for (var i = repeat; i >= 0; i--) {
const regex = /(.*\s)([0-9]{4,})(\s.*)/gm;
const str = "Terrace 07541207031 RDL 18.02";
const subst = `$1$3`;
var match = str.replace(regex, subst);
}
const end = Date.now() - start;
console.log("YAAAY! \"" + match + "\" is a match ");
console.log(end / 1000 + " is the runtime of " + repeat + " times benchmark test. ");
如果这不是您想要的表达式,则可以在regex101.com中修改/更改表达式。
您还可以在jex.im中可视化您的表达式: