Javascript-具有特定值的标记的数组

时间:2012-08-10 22:32:51

标签: javascript arrays token tokenize

假设我有数组['dcab', 'feac', 'gwad', 'dnae'],但想要使每个'a'都在其自己的标记中,例如['dc', 'a', 'b', 'fe', 'a', 'c', 'gw', 'a', 'd', 'dn', 'a', 'e'];。我该怎么办?谢谢!

4 个答案:

答案 0 :(得分:7)

var x = ['dcab', 'feac', 'gwad', 'dnae'];
x = x.join('-').replace(/a/g,"-a-").split('-');

更新:正如@Robert指出的那样,如果您在开头或结尾有'a',这将导致''空白字符串出现在最终数组中。您可以通过执行以下操作来删除空字符串来解决此问题:

x.join('-').replace(/a/g,"-a-").split('-').filter(function(x) { return x!='' });

或者,对于性能可能存在问题的大型数组,您可以使用另一个.replace()简单地删除额外的分隔符(这可能是更好的方法,尽管它不可​​读):

x.join('-').replace(/a/g,"-a-").replace(/^\-|\-(?=\-)|\-$/g,'').split('-');

当然,一旦你可以保证你的分隔符不在你的任何字符串中,你的分隔符可以是任何东西(它不一定是'-')。

答案 1 :(得分:4)

var arr = ['dcab', 'feac', 'gwad', 'dnae'];
var result = [];
var i;
var s;

for (i = 0; i < arr.length; i++) {
    s = arr[i].split('a');
    result.push(s[0]);
    if (s.length > 1) {
        result.push('a');
        result.push(s[1]);
    }
}

仅当每个字符串包含一个或零个'a'字符时才有效。如果可以包含更多内容,您可以遍历拆分结果。

答案 2 :(得分:3)

var arr = ['dcab', 'feac', 'gwad', 'dnae'];

var new_arr = arr.reduce(function(ret, val) {
    ret.push.apply(ret, val.split(/(a)/))
    return ret;
}, []);

请注意,某些较旧的浏览器不支持捕获和保留拆分字符。


像这样简洁......

var new_arr = arr.reduce(function(ret, val) {
    return ret.concat(val.split(/(a)/));
}, []);

答案 3 :(得分:0)

首先,分别处理数组元素并提取其标记。然后结合结果。

您正在寻找3种类型的令牌:

  • 一个&#34; a&#34;。正则表达式为/a/
  • 一系列其他字符=&gt; /[^a]+/
  • 当原始元素为空字符串时,您希望保留该字符串=&gt; /^$/

总而言之,令牌的正则表达式为/a|[^a]+|^$/。要提取所有标记,您需要包含全局搜索标记g

var strings = ['dcab', 'feac', 'gwad', 'dnae'];

var arrays = strings.map(function(string) {
    return string.match(/[^a]+|a|^$/g);
});

match返回一个数组,其中包含在字符串中找到的标记。剩下要做的就是连接所有这些数组。

幸运的是,有一个数组方法只是为了这个特定的目的。但不幸的是,使用未知数量的数组并不容易:

var tokens = arrays[0].concat(arrays[1], arrays[2], ...

首先,您不知道自己拥有多少阵列。所以没有办法传递正确数量的参数。但也许你甚至不知道array[0]是否存在。所以你最好用一个空数组作为起点。

但是有很多方法可以解决这个问题。

一种解决方案是将连接分为多个步骤:

var tokens = arrays.reduce(function(result, array) {
    return result.concat(array);
}, []); // note the initial empty array

但对我而言,使用apply并一次传递所有数组似乎更合适:

var concat = Array.prototype.concat;
var tokens = concat.apply([], arrays);

所有放在一起的代码看起来像这样:

var strings = ['dcab', 'feac', 'gwad', 'dnae'];
var concat = Array.prototype.concat;

var tokens = concat.apply([], strings.map(function(string) {
    return string.match(/[^a]+|a|^$/g);
}));