按长度拆分字符串

时间:2009-06-17 22:31:28

标签: c# .net regex split

我有一个字符串值,其长度为5000 +字符长,我希望将其拆分为76个字符长,并在每个76个字符的末尾添加一个新行。我怎么在c#中做到这一点?

13 个答案:

答案 0 :(得分:15)

如果您正在编写Base64数据,请尝试编写

Convert.ToBase64String(bytes, Base64FormattingOptions.InsertLineBreaks);

这将每76个字符插入一个换行符

答案 1 :(得分:4)

有点丑陋......但速度要快得多;)(这个版本花了161个嘀嗒...... Aric的花了413)

我在我的博客上发布了测试代码。 http://hackersbasement.com/?p=134 (我还发现StringBuilder比string.Join慢得多)

http://hackersbasement.com/?p=139< =已更新的结果

    string chopMe = "ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz0123456789";

    Stopwatch sw = new Stopwatch();

    sw.Start();
    char[] chopMeArray = chopMe.ToCharArray();
    int totalLength = chopMe.Length;
    int partLength = 12;
    int partCount = (totalLength / partLength) + ((totalLength % partLength == 0) ? 0 : 1);
    int posIndex = 0;
    char[] part = new char[partLength];
    string[] parts = new string[partCount];
    int get = partLength;
    for (int i = 0; i < partCount; i++)
    {
        get = Math.Min(partLength, totalLength - posIndex);
        Array.Copy(chopMeArray, posIndex, part, 0, get);
        parts[i] = new string(part, 0, get);
        posIndex += partLength;
    }

    var output = string.Join("\r\n", parts) + "\r\n";
    sw.Stop();
    Console.WriteLine(sw.ElapsedTicks);

答案 2 :(得分:4)

就此而言,如果您想要StringBuilder与字符串性能相关,那么最好的文章就是here找到的代码项目。

alt text

(但不显示字符串大小)

简而言之,StringBuilder在使用字符串长度(或重复的contactenation)满足阈值之前不会更快,你很好,所以坚持常规的字符串连接和字符串方法。

答案 3 :(得分:4)

试试这个:

s = Regex.Replace(s, @"(?<=\G.{76})", "\r\n");

编辑:显然,这是目前为止发布的所有帖子中最慢的方法。我想知道如果你预先编译正则表达式它会怎么做:

Regex rx0 = new Regex(@"(?<=\G.{76})");

s = rx0.Replace(s, "\r\n"); // only time this portion

此外,它与直接匹配方法相比如何?

Regex rx1 = new Regex(".{76}");

s = rx1.Replace(s, "$0\r\n"); // only time this portion

我一直想知道那些无界的外观是多么昂贵。

答案 4 :(得分:2)

public static string InsertNewLine(string s, int len)
{
    StringBuilder sb = new StringBuilder(s.Length + (int)(s.Length/len) + 1);
    int start = 0;
    for (start=0; start<s.Length-len; start+=len)
    {
        sb.Append(s.Substring(start, len));
        sb.Append(Environment.NewLine);
    }
    sb.Append(s.Substring(start));
    return sb.ToString();
}

其中 s 是您的输入字符串, len 是所需的行长度(76)。

答案 5 :(得分:1)

string[] FixedSplit(string s, int len)
{
   List<string> output;
   while (s.Length > len)
   {
      output.Add(s.Substring(0, len) + "\n");
      s.Remove(0, len);
   }
   output.Add(s + "\n");
   return output.ToArray();
}

答案 6 :(得分:1)

public static IEnumerable<string> SplitString(string s, int length)
{
    var buf = new char[length];
    using (var rdr = new StringReader(s))
    {
        int l;
        l = rdr.ReadBlock(buf, 0, length);
        while (l > 0)
        {
            yield return (new string(buf, 0, l)) + Environment.NewLine;
            l = rdr.ReadBlock(buf, 0, length);
        }
    }
}

然后将它们重新组合在一起:

string theString = GetLongString();
StringBuilder buf = new StringBuilder(theString.Length + theString.Length/76);
foreach (string s in SplitString(theString, 76) { buf.Append(s); }
string result = buf.ToString();

或者你可以这样做:

string InsertNewLines(string s, int interval)
{
    char[] buf = new char[s.Length + (int)Math.Ceiling(s.Length / (double)interval)];

    using (var rdr = new StringReader(s))
    {
        for (int i=0; i<buf.Length-interval; i++)
        {
            rdr.ReadBlock(buf, i, interval);
            i+=interval;
            buf[i] = '\n';
        }
        if (i < s.Length)
        {
            rdr.ReadBlock(buf, i, s.Length - i);
            buf[buf.Length - 1] = '\n';
        }
    }
    return new string(buf);
}

答案 7 :(得分:0)

最后,这将是我会使用的,我认为

    static string fredou()
    {
        string s = "ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz0123456789";
        int partLength = 12;

        int stringLength = s.Length;
        StringBuilder n = new StringBuilder(stringLength + (int)(stringLength / partLength) + 1);
        int chopSize = 0;
        int pos = 0;

        while (pos < stringLength)
        {
            chopSize = (pos + partLength) < stringLength ? partLength : stringLength - pos;
            n.Append(s , pos, chopSize);
            n.Append("\r\n");
            pos += chopSize;
        }

        return n.ToString();         
    }

通过查看反射器下的AppendLine:

    <ComVisible(False)> _
    Public Function AppendLine(ByVal value As String) As StringBuilder
        Me.Append(value)
        Return Me.Append(Environment.NewLine)
    End Function

    Public Shared ReadOnly Property NewLine As String
        Get
            Return ChrW(13) & ChrW(10)
        End Get
    End Property

对我而言,速度明智,手动完成&gt; AppendLine

答案 8 :(得分:0)

还有一个....(第一次通过慢速,后续运行,类似于上面发布的更快的时间)

private void button1_Click(object sender, EventArgs e)
{
  string chopMe = "ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz0123456789";
  Stopwatch sw = new Stopwatch();
  sw.Start();
  string result = string.Join("\r\n", ChopString(chopMe).ToArray());
  sw.Stop();
  MessageBox.Show(result + " " + sw.ToString());
}


public IEnumerable<string> ChopString(string s)
{
  int i = 0;
  while (i < s.Length)
  {
    yield return i + PARTLENGTH <= s.Length ? s.Substring(i,PARTLENGTH) :s.Substring(i) ;
    i += PARTLENGTH;
  }
}

编辑:我很想知道子串有多快......

答案 9 :(得分:0)

这个字符串是5000个字符......我不认为速度真的很重要,除非你做了数千甚至数百万次,特别是当OP甚至没有提到速度很重要时。过早优化?

我可能会使用递归,因为在我看来,它会导致最简单的代码。

这可能在语法上不正确,因为我知道.NET而不是C#。

String ChunkString(String s, Integer chunkLength) {
    if (s.Length <= chunkLength) return s;
    return String.Concat(s.Substring(0, chunkLength), 
                         ChunkString(s.Substring(chunkLength)));
}

答案 10 :(得分:0)

主要是为了它的乐趣,这里是一个不同的解决方案实现为字符串的扩展方法: (\ r \ n明确使用,因此只支持换行格式);

public static string Split(this string str, int len)
        {
            char org = str.ToCharArray();
            int parts = str.Length / len + (str.Length % len == 0 ? 0 : 1);
            int stepSize = len + newline.Length;
            char[] result = new char[parts * stepSize];
            int resLen = result.Length;

            for (int i =0;i<resLen ;i+stepSize)
            {
                Array.Copy(org,i*len,result,i*stepSize);
                resLen[i++] = '\r';
                resLen[i++] = '\n';
            }
            return new string(result);
        }

答案 11 :(得分:0)

我将字符串拆分为35

var tempstore ="12345678901234567890123456789012345";
for (int k = 0; k < tempstore.Length; k += 35)
{
   PMSIMTRequest.Append(tempstore.Substring(k, tempstore.Length - k > 35 ? 35 : tempstore.Length - k));
   PMSIMTRequest.Append(System.Environment.NewLine);
}
messagebox.Show(PMSIMTRequest.tostring());

答案 12 :(得分:0)

@ M4N的答案很好,但是我认为while statementfor statement更容易理解。

public static string InsertNewLine(string source, int len = 76)
{
    var sb = new StringBuilder(source.Length + (int)(source.Length / len) + 1);
    var start = 0;
    while ((start + len) < source.Length)
    {
        sb.Append(source.Substring(start, len));
        sb.Append(Environment.NewLine);
        start += len;
    }
    sb.Append(source.Substring(start));
    return sb.ToString();
}