使用正则表达式解析文本文件

时间:2012-05-18 10:47:19

标签: c# regex linq

我有一个包含以下内容的文本文件:

Warning 18.05.2012 16:27:45 www.site.com    0   None    BusyCount: 00:00:00.0000880
Warning 18.05.2012 16:27:45 www.site.com    0   None    GetBusyPlace: 00:00:00.7759916
Warning 18.05.2012 16:27:44 www.site.com    0   None    GetHallPlan: 00:00:00.0098537
Warning 18.05.2012 16:27:44 www.site.com    0   None    GetSeatPrice: 00:00:00.1462649
Warning 18.05.2012 16:27:40 www.site.com    0   None    BusyCount: 00:00:00.0000988
Warning 18.05.2012 16:27:40 www.site.com    0   None    GetBusyPlace: 00:00:00.7330764
Warning 18.05.2012 16:27:39 www.site.com    0   None    GetHallPlan: 00:00:00.0435432

我有三个数组:

List<string> getSeatPrice = new List<string>();
List<string> getBusyCounts = new List<string>();
List<string> getHallPlan = new List<string>();

如何解析此文本文件并从字符串中获取时间,例如GetBusyPlace: 00:00:00.7759916并放入适当的数组?

由于

2 个答案:

答案 0 :(得分:2)

看起来文件中的每一行都是以空格分隔的标记集。在这种情况下最简单的方法是使用String.Split(),并通过其在字符串中的位置获取所需的标记。

var getSeatPrice = new List<string>();
var getBusyCounts = new List<string>();
var getHallPlan = new List<string>();
foreach (var line in File.ReadAllLines("c:\\data\\myfile.txt")) {
    var tokens = line.Split('\t', ' ');
    var kind = tokens[6];
    var value = tokens[7];
    switch (kind) {
        case "GetSeatPrice:":
            getSeatPrice.Add(value);
        break;
        case "BusyCount:":
            getBusyCounts.Add(value);
        break;
        case "getHallPlan:":
            getHallPlan.Add(value);
        break;
    }
}

答案 1 :(得分:1)

看起来像固定宽度的字段格式。

我建议使用Microsoft.VisualBasic.FileIO命名空间中的TextFieldParser类(只需添加对Microsoft.VisualBasic.dll的引用,您就可以了。)

这是一个.NET库,您可以设置它来指定字段宽度和类型,以获得字段的强类型视图。