如何使用特定字符串将文本拆分为段落

时间:2013-05-24 07:20:27

标签: c# regex

我有一个很长的文本文件...我读了文本文件并将内容存储在一个字符串中...... 现在我希望这个文本分裂。以下是显示我想要的图像。 在图像“ 这是常见文字 ”中表示此字符串在每个段落中都很常见。

enter image description here

绿色正方形显示我想在字符串数组中使用该部分。 但是如何做到这一点...我已经尝试过正则表达式......但是没有用...... 请帮忙

2 个答案:

答案 0 :(得分:0)

我不确定你想分开什么,但你可以使用

string[] stringArray = Regex.Split(yourString, regex); 

如果你想要一个更具体的例子,你必须(正如其他人提到的那样)给我们提供更多关于文本内容的信息,而不仅仅是"普通文本"。

答案 1 :(得分:0)

尝试使用此模式RegEx.Split()

(.*This is common text.*)

好吧,在priority to RegEx上提供string functions总是会导致性能开销。

如果您使用以下内容会很棒:( UnTested 但它会给您一个想法)

string[] lines = IO.File.ReadAllLines("FilePath")
List<string> lst = new List<string>();
List<string> lstgroup = new List<string>();

int i=0;
foreach(string line in lines)
{
    if(line.Tolower().contains("this is common text"))
    {
         if(i > 0)
         {
             lst.AddRange(lstgroup.ToArray());

             // Print elements here
             lstgroup.Clear();
         }
         else { i++; }
         continue;
    }
    else
    {
      lstgroup.Add(line)
    }
}
i = 0;
// Print elements here too