缺少正则表达式的括号

时间:2013-01-15 09:37:03

标签: javascript regex parentheses

我是否认为正则表达式不能用于检测缺失的括号(因为无法计算对)?使用JavaScript我有大约一千个被截断的字符串,需要手工编辑。我希望能够将这个列表缩小到使用代码需要注意的列表。字符串可以被认为是:

  • (这很好,不需要注意)
  • 这也是[罚款]
  • 这很糟糕(需要编辑
  • 这[[也]不好
  • 就是这样}坏
  • 此字符串没有任何类型的括号,但也必须考虑

如果这不可能,那么我只需编写一个函数来查找括号对。谢谢

4 个答案:

答案 0 :(得分:8)

function isFine(str) {  
  return /[(){}\[\]]/.test( str ) && 
    ( str.match( /\(/g ) || '' ).length == ( str.match( /\)/g ) || '' ).length &&
    ( str.match( /\[/g ) || '' ).length == ( str.match( /]/g ) || '' ).length &&
    ( str.match( /{/g ) || '' ).length == ( str.match( /}/g ) || '' ).length;
}

测试

isFine('(this is fine and does not need attention)');                 // true
isFine('This is also [fine]');                                        // true
isFine('This is bad( and needs to be edited');                        // false
isFine('This [is (also) bad');                                        // false
isFine('as is this} bad');                                            // false
isFine('this string has no brackets but must also be considered');    // false

但请注意,这不会检查括号顺序,即a)b(c会被视为罚款。

对于记录,这是一个检查缺失括号并检查每种类型是否正确平衡的函数。它不允许a)b(c,但它允许(a[bc)d],因为每种类型都会单独检查。

function checkBrackets( str ) {
    var lb, rb, li, ri,
        i = 0,
        brkts = [ '(', ')', '{', '}', '[', ']' ];   
    while ( lb = brkts[ i++ ], rb = brkts[ i++ ] ) { 
        li = ri = 0;
        while ( li = str.indexOf( lb, li ) + 1 ) {
            if ( ( ri = str.indexOf( rb, ri ) + 1 ) < li ) {
                return false;
            }
        }
        if ( str.indexOf( rb, ri ) + 1 ) {
            return false;
        } 
    }
    return true;
}

最后,除了Christophe的帖子之外,这里似乎是检查缺失括号并检查所有内容是否正确平衡和嵌套的最佳解决方案:

function checkBrackets( str ) {
    var s;
    str = str.replace( /[^{}[\]()]/g, '' );
    while ( s != str ) { 
        s = str;
        str = str.replace( /{}|\[]|\(\)/g, '' )
    }
    return !str;
};

checkBrackets( 'ab)cd(efg' );        // false   
checkBrackets( '((a)[{{b}}]c)' );    // true   
checkBrackets( 'ab[cd]efg' );        // true   
checkBrackets( 'a(b[c)d]e' );        // false   

答案 1 :(得分:3)

你不能在正则表达式本身进行递归,但是你总是可以在JavaScript中进行。

以下是一个例子:

// First remove non-brackets:
string=string.replace(/[^{}[\]()]/g,"");
// Then remove bracket pairs recursively
while (string!==oldstring) {
  oldstring=string;
  string=string.replace(/({}|\[\]|\(\))/g,"");
}

其余部分是不匹配的括号。

现场演示:http://jsfiddle.net/3Njzv/

如果您需要计算对数,您可以一次更换一个并添加一个计数器:

// First remove non-brackets:
string=string.replace(/[^{}[\]()]/g,"");

// Then remove bracket pairs recursively
var counter=-1;
while (string!==oldstring) {
  counter ++;
  oldstring=string;
  string=string.replace(/({}|\[\]|\(\))/,"");
}

答案 2 :(得分:2)

可以使用递归正则表达式来验证匹配的括号。例如,在Perl中,以下表达式匹配具有正确() {} []嵌套的字符串:

$r = qr/(?:(?>[^(){}\[\]]+)|\((??{$r})\)|\{(??{$r})\}|\[(??{$r})\])*/;

为了清楚起见,这是相同的表达式:

$r = qr/
    (?:
        (?>
            [^(){}\[\]]+
        )
    |
        \(
            (??{$r})
        \)
    |
        \{
            (??{$r})
        \}
    |
        \[
            (??{$r})
        \]
    )*
/x;

外部组使用*而不是+进行量化,以便匹配空字符串,因此为了使$r有用,实际匹配必须使用表达式来完成利用前瞻/后视或以其他方式建立上下文,例如/^$r$/。例如,以下内容仅打印文件中没有正确嵌套的行:

perl -ne '$r = qr/(?:(?>[^(){}\[\]]+)|\((??{$r})\)|\{(??{$r})\}|\[(??{$r})\])*/; print if !m/^$r$/' file

要解决您的澄清:如果这些是文件名而不是文件内容,您可以将lsfind或其他任何内容输出到上述命令中,无法file

ls | perl -ne '$r = qr/(?:(?>[^(){}\[\]]+)|\((??{$r})\)|\{(??{$r})\}|\[(??{$r})\])*/; print if !m/^$r$/'

然而,正如其他人所说,非正则表达式解决方案通常可能更好。

N.B。来自Perl doc:“警告:此扩展的正则表达式功能被认为是实验性的,并且可能会在不事先通知的情况下进行更改。由于未来优化的影响,具有副作用的代码在版本之间可能无法完全相同。正则表达式引擎。“

答案 3 :(得分:1)

一些正则表达式的风格能够匹配嵌套括号等递归结构,但语法非常复杂,编写函数通常更容易。 JavaScript正则表达式根本不支持递归。