节点如何通过换行符('\ n')拆分字符串?

时间:2014-02-19 23:54:36

标签: javascript node.js

如何在节点中按换行符('\ n')拆分字符串? 我有简单的字符串,如var a = "test.js\nagain.js",我需要["test.js", "again.js"]。 我试过了

a.split("\n");
a.split("\\n");
a.split("\r\n");
a.split("\r");

但以上都不起作用。

7 个答案:

答案 0 :(得分:177)

尝试拆分像/\r?\n/这样的正则表达式,以供Windows和UNIX系统使用。

> "a\nb\r\nc".split(/\r?\n/)
[ 'a', 'b', 'c' ]

答案 1 :(得分:37)

如果文件是您的系统的原生文件(当然不能保证),那么Node可以帮助您:

var os = require('os');

a.split(os.EOL);

这对于从Node构建输出字符串通常更有用,因为它具有平台可移植性。

答案 2 :(得分:25)

a = a.split("\n");

请注意split ting返回新数组,而不是仅将其分配给原始字符串。您需要将其显式存储在变量中。

答案 3 :(得分:14)

适用于所有可能的行结尾的解决方案,包括 混合和保持空行也可以实现 两个替换和一个拆分如下

text.replace(/\r\n/g, "\r").replace(/\n/g, "\r").split(/\r/);

一些代码来测试它

  var CR = "\x0D";  //   \r
  var LF = "\x0A";  //   \n

  var mixedfile = "00" + CR + LF +            // 1 x win
                  "01" + LF +                 // 1 x linux
                  "02" + CR +                 // 1 x old mac
                  "03" + CR + CR +            // 2 x old mac
                  "05" + LF + LF +            // 2 x linux
                  "07" + CR + LF + CR + LF +  // 2 x win
                  "09";

  function showarr (desc, arr)
  {
     console.log ("// ----- " + desc);
     for (var ii in arr)
        console.log (ii + ") [" + arr[ii] +  "] (len = " + arr[ii].length + ")");
  }

  showarr ("using 2 replace + 1 split", 
           mixedfile.replace(/\r\n/g, "\r").replace(/\n/g, "\r").split(/\r/));

和输出

  // ----- using 2 replace + 1 split
  0) [00] (len = 2)
  1) [01] (len = 2)
  2) [02] (len = 2)
  3) [03] (len = 2)
  4) [] (len = 0)
  5) [05] (len = 2)
  6) [] (len = 0)
  7) [07] (len = 2)
  8) [] (len = 0)
  9) [09] (len = 2)

答案 4 :(得分:8)

看起来正则表达式/\r\n|\r|\n/处理CR,LF和CRLF的行尾,它们的混合序列,并保持它们之间的所有空行。试试吧!

function splitLines(t) { return t.split(/\r\n|\r|\n/); }

// single newlines
splitLines("AAA\rBBB\nCCC\r\nDDD");
// double newlines
splitLines("EEE\r\rFFF\n\nGGG\r\n\r\nHHH");
// mixed sequences
splitLines("III\n\r\nJJJ\r\r\nKKK\r\n\nLLL\r\n\rMMM");

您应该得到以下数组:

[ "AAA", "BBB", "CCC", "DDD" ]
[ "EEE", "", "FFF", "", "GGG", "", "HHH" ]
[ "III", "", "JJJ", "", "KKK", "", "LLL", "", "MMM" ]

您还可以通过添加|\xHH|\uHHHH部分(其中H是附加终止符字符代码点的十六进制数字)来教该正则表达式识别其他合法Unicode line terminators (在Wikipedia文章中以U+HHHH开头)。

答案 5 :(得分:6)

第一个应该有效:

> "a\nb".split("\n");
[ 'a', 'b' ]
> var a = "test.js\nagain.js"
undefined
> a.split("\n");
[ 'test.js', 'again.js' ]

答案 6 :(得分:4)

我使用eol module来处理节点或浏览器中的行结尾。它有一个分割方法,如

var lines = eol.split(text)