Javascript:用逗号分隔字符串,括号内除外

时间:2014-07-31 11:46:19

标签: javascript parsing

在表格中给出字符串:

'"abc",ab(),c(d(),e()),f(g(),zyx),h(123)'

如何拆分它以获得以下数组格式:

abc
ab()
c(d(),e())
f(g(),zyx)
h(123)

我尝试过普通的javascript拆分,但是它没有按预期工作。尝试正则表达但尚未成功。

5 个答案:

答案 0 :(得分:5)

您可以跟踪括号,并在左右parens均衡时添加这些表达式。

例如 -

function splitNoParen(s){
    var left= 0, right= 0, A= [], 
    M= s.match(/([^()]+)|([()])/g), L= M.length, next, str= '';
    for(var i= 0; i<L; i++){
        next= M[i];
        if(next=== '(')++left;
        else if(next=== ')')++right;
        if(left!== 0){
            str+= next;
            if(left=== right){
                A[A.length-1]+=str;
                left= right= 0;
                str= '';
            }
        }
        else A=A.concat(next.match(/([^,]+)/g));
    }
    return A;
}

var s1= '"abc",ab(),c(d(),e()),f(g(),zyx),h(123)';
splitNoParen(s1).join('\n');

/*  returned value: (String)
"abc"
ab()
c(d(),e())
f(g(),zyx)
h(123)
*/

答案 1 :(得分:5)

这可能不是最佳或更精简的解决方案,也可能不适合每一种可能性,但根据您的示例,它可行:

var data = '"abc",ab(),c(d(),e()),f(g(),zyx),h(123)';
// Create a preResult splitting the commas.
var preResult = data.replace(/"/g, '').split(',');
// Create an empty result.
var result = [];

for (var i = 0; i < preResult.length; i++) {
    // Check on every preResult if the number of parentheses match.
    // Opening ones...
    var opening = preResult[i].match(/\(/g) || 0;
    // Closing ones...
    var closing = preResult[i].match(/\)/g) || 0;

    if (opening != 0 &&
        closing != 0 &&
        opening.length != closing.length) {
        // If the current item contains a different number of opening
        // and closing parentheses, merge it with the next adding a 
        // comma in between.
        result.push(preResult[i] + ',' + preResult[i + 1]);
        i++;
    } else {
        // Leave it as it is.
        result.push(preResult[i]);
    }
}

Demo

答案 2 :(得分:3)

为了将来参考,这是使用string.replace作为控制流操作符的另一种顶级拆分方法:

function psplit(s) {
  var depth = 0, seg = 0, rv = [];
  s.replace(/[^(),]*([)]*)([(]*)(,)?/g,
            function (m, cls, opn, com, off, s) {
    depth += opn.length - cls.length;
    var newseg = off + m.length;
    if (!depth && com) {
      rv.push(s.substring(seg, newseg - 1));
      seg = newseg;
    }
    return m;
  });
  rv.push(s.substring(seg));
  return rv;
}

console.log(psplit('abc,ab(),c(d(),e()),f(g(),zyx),h(123)'))

["abc", "ab()", "c(d(),e())", "f(g(),zyx)", "h(123)"]

让它处理引号也不会太复杂,但在某些时候你需要决定使用真正的解析器,如jison,我怀疑这将是重点。无论如何,问题中没有足够的细节来了解双引号的理想处理方式。

答案 3 :(得分:1)

你不能使用.split,但是你必须编写一个像这样的小解析器:

function splitNoParen(s){
  let results = [];
  let next;
  let str = '';
  let left = 0, right = 0;

  function keepResult() {
    results.push(str);
    str = '';
  }

  for(var i = 0; i<s.length; i++) {
    switch(s[i]) {
    case ',': 
      if((left === right)) {
        keepResult();
        left = right = 0;
      } else {
        str += s[i];
      }
      break;
    case '(':
      left++;
      str += s[i];
      break;
    case ')':
      right++;
      str += s[i];
      break;
    default: 
      str += s[i];
    }
  }
  keepResult();
  return results;
}
  
var s1= '"abc",ab(),c(d(),e()),f(g(),zyx),h(123)';
console.log(splitNoParen(s1).join('\n'));

var s2='cats,(my-foo)-bar,baz';
console.log(splitNoParen(s2).join('\n'));

答案 4 :(得分:-2)

<强>的Javascript

var str='"abc",ab(),c(d(),e()),f(g(),zyx),h(123)'
str.split('"').toString().split(',').filter(Boolean);

这应该有效