使用Regex从c#中的单词中删除#

时间:2013-03-02 12:26:07

标签: c# regex c#-4.0

我想阅读“#”附加到单词的文件我想从单词中删除它 输入文件

a, 00001740, 0.125, 0,     able#1
a, 00001740, 0.125, 0,     play#2
a, 00002098, 0,     0.75,  unable#1

我想要的是以下格式,没有
输出应为此

a, 00001740, 0.125,  0,      able
a, 00001740, 0 .125, 0,      play
a, 00002098, 0,      0.75,   unable

我写下面的代码

TextWriter tw = new StreamWriter("D:\\output.txt");
private void button1_Click(object sender, EventArgs e)
        {
            if (textBox1.Text != "")
            {

                StreamReader reader = new StreamReader("D:\\input.txt"); 
                string line;
                while ((line = reader.ReadLine()) != null)
                {
                    Regex expression = new Regex(@"\b\w+(?=#\d*\b)");
                    var results = expression.Matches(reader.ToString())
                    foreach (Match match in results)
                    {


                        tw.Write(match);

                    }
                    tw.Write("\r\n");
                }
                tw.Close();
                reader.Close();
            }
            textBox1.Text = "";                    
        }
    }

5 个答案:

答案 0 :(得分:1)

使用Regex.Replace()

string result = Regex.Replace(input, "#.*", "");

答案 1 :(得分:0)

您可能希望将其写入其他文件,因为如果您不想读取和缓存文件的整个内容,则在读取原始文件的内容时会重写该文件。

另外,请考虑以下示例:

int index = line.IndexOf("#");
if (index != -1)
{
    line = line.Substring(0, index - 1);
}

在这里你不必处理正则表达式,因此运行速度会快得多。

答案 2 :(得分:0)

您的整个代码可以替换为3行:

string txt = File.ReadAllText("D:\\input.txt");
txt = Regex.Replace(txt, "#.*?(\r\n|\n|$)", "$1");
File.WriteAllText("D:\\output.txt", txt);

答案 3 :(得分:0)

正则表达式替换可能是最好的选择。

 File.WriteAllLines("c:\\output.txt", File.ReadAllLines("c:\\input.txt").Select(line => Regex.Replace(line, "#.*","")));

或者可能是TakeWhile

File.WriteAllLines("c:\\test24.txt", File.ReadAllLines("c:\\test.txt").Select(line => new string(line.TakeWhile(c => c != '#').ToArray())));

答案 4 :(得分:0)

根据我的评论试试这个:

        string s = "a, 00001740, 0.125, 0,     able#1";
        string m = Regex.Replace(s, @"#\d$", ""); 
        //for more than one digit  @"#\d+$"
        Console.WriteLine(m);
        Console.ReadLine();