我需要根据文件名中的日期过滤目录中的文件。
该名称有四组数字:
9999.99999.201305021219.99999999.txt
当有多个文件且第二组数字重复时,我想根据第三组数字(YYYYMMDDHHMM)上的日期使用较新的文件。
如果目录中有这些文件:
1 1100.04037.201305090945.04542592.TXT
2 1100.04041.201305091108.04542707.TXT
3 1100.04041.201305091117.60563353.TXT
4 1100.04047.201305080942.04541666.TXT
5 1100.24084.201305021658.04539125.TXT
6 1100.24084.201305061731.04540560.TXT
我想要丢弃第2行和第5行中的那些。这就是我设法迭代目录文件的方式:
public static void Main(string[] args)
{
string directory = @"\\some\net\path";
string[] arquivos = Directory.GetFiles(directory, "1100.*.txt", SearchOption.TopDirectoryOnly);
foreach (string arquivo in arquivos)
{
Console.WriteLine(arquivo.Substring(directory.Length + 1));
}
Console.ReadLine();
}
答案 0 :(得分:3)
var files = arquivos
.Select(f => new{OrgName = f, Parts = new FileInfo(f).Name.Split('.')})
.GroupBy(x=>x.Parts[1])
.Select(g=>g.OrderByDescending(x=>x.Parts[2]).First().OrgName);
foreach (string arquivo in files)
{
.....
}
答案 1 :(得分:2)
根据目录中的文件数量,我建议使用字典在迭代文件夹时保存值。您可以使用第二组数字作为键,然后检查该键是否已存在于词典中。如果是,您可以执行任何比较拟合,以确定您保留哪一个。
答案 2 :(得分:1)
var ci = CultureInfo.InvariantCulture;
// first, parse your input files:
var parsed =
from f in arquivos
let c = Path.GetFileName(f).Split('.')
select new
{
Key = c[1],
Name = f,
Date = DateTime.ParseExact(c[2], "yyyyMMddHHmm", ci)
};
// now, group by file id, and order by file date,
// picking record by latest date:
var result =
parsed.GroupBy(g => g.Key)
.Select(t => t.OrderByDescending(z => z.Date)
.Select(z => z.Name).First()).ToList();