根据文件名中的日期过滤目录中的文件

时间:2013-05-14 19:27:35

标签: c# list file-io filter

我需要根据文件名中的日期过滤目录中的文件。

该名称有四组数字:

9999.99999.201305021219.99999999.txt

当有多个文件且第二组数字重复时,我想根据第三组数字(YYYYMMDDHHMM)上的日期使用较新的文件。

如果目录中有这些文件:

1   1100.04037.201305090945.04542592.TXT
2   1100.04041.201305091108.04542707.TXT
3   1100.04041.201305091117.60563353.TXT
4   1100.04047.201305080942.04541666.TXT
5   1100.24084.201305021658.04539125.TXT
6   1100.24084.201305061731.04540560.TXT

我想要丢弃第2行和第5行中的那些。这就是我设法迭代目录文件的方式:

    public static void Main(string[] args)
    {
        string directory = @"\\some\net\path";
        string[] arquivos = Directory.GetFiles(directory, "1100.*.txt", SearchOption.TopDirectoryOnly);
        foreach (string arquivo in arquivos)
        {
            Console.WriteLine(arquivo.Substring(directory.Length + 1));
        }
        Console.ReadLine();
    }

3 个答案:

答案 0 :(得分:3)

var files = arquivos
           .Select(f => new{OrgName = f, Parts = new FileInfo(f).Name.Split('.')})
           .GroupBy(x=>x.Parts[1])
           .Select(g=>g.OrderByDescending(x=>x.Parts[2]).First().OrgName);

foreach (string arquivo in files)
{
    .....
}

答案 1 :(得分:2)

根据目录中的文件数量,我建议使用字典在迭代文件夹时保存值。您可以使用第二组数字作为键,然后检查该键是否已存在于词典中。如果是,您可以执行任何比较拟合,以确定您保留哪一个。

答案 2 :(得分:1)

var ci = CultureInfo.InvariantCulture;

// first, parse your input files:
var parsed = 
from f in arquivos 
let c = Path.GetFileName(f).Split('.')
select new 
{ 
  Key = c[1], 
  Name = f, 
  Date = DateTime.ParseExact(c[2], "yyyyMMddHHmm", ci) 
};

// now, group by file id, and order by file date, 
// picking record by latest date:
var result = 
parsed.GroupBy(g => g.Key)
.Select(t => t.OrderByDescending(z => z.Date)
.Select(z => z.Name).First()).ToList();