多个通配符目录/文件在C#.net中搜索任意目录结构

时间:2016-04-20 19:11:23

标签: c# .net search directory

我正在使用C#和.net 4.0在Visual Studio 2012中构建Windows应用程序。

该程序的一个功能是搜索符合给定搜索条件的所有文件,这些文件通常(但并不总是)包含通配符。

搜索条件在运行时未知;它是从excel电子表格中导入的。

可能的搜索条件可包括以下内容:

  1. 确切的路径
    • " C:\ TEMP \ directory1中\ directory2 \ someFile.txt"
  2. 路径,文件名中包含通配符:
    • " C:\ TEMP \ directory1中\ directory2 * *"
  3. 文件名,路径中包含通配符:
    • " C:\ temp中* \目录* \ someFile.txt"
  4. 带通配符的文件名和路径:
    • " C:\ TEMP \ * \ * \ *。*"
  5. 以上所有内容,具有任意目录结构:
    • " C:\ TEMP \ DIR * 1个\ DIR * \ anotherdir \ * \另一个* \文件* .TXT"
    • " C:\ Te *的\ * \ someFile.txt"
    • " C:\ TEMP \ * tory1 \可怕* 2 \ * \ * \ * \ * \ *。*"
  6. 我试图使用Directory.EnumerateFiles

    IEnumerable<string> matchingFilePaths = System.IO.Directory.EnumerateFiles(@"C:\", selectedItemPath[0], System.IO.SearchOption.AllDirectories);
    

    但是这只适用于上面的案例2。尝试在文件夹名称中使用带有通配符的Directory.EnumerateFiles会导致&#34;非法字符&#34;豁免。

    我希望在.net中有一个单线程,我可以用来进行这个文件搜索。通配符的数量和目录结构的深度在运行时是未知的,并且可以想象搜索可能必须深入一百个文件夹,每个文件夹包含未知数量的通配符。 (这是问题的关键)。试图避免使用疯狂数量的嵌套for循环。

    我阅读了解决方案here,但这似乎不适用于任意文件夹结构。

2 个答案:

答案 0 :(得分:1)

经过更多搜索,结果证明这是一个非常简单的解决方案。我可以使用Windows Powershell Get-ChildItem命令:

using System.Management.Automation;

PowerShell ps = PowerShell.Create();
ps.AddCommand("Get-ChildItem");
ps.AddArgument(selectedItemPath[0]);
foreach (var result in ps.Invoke())
{
    //display the results in a textbox
}

这允许我们避免嵌套的for循环。

答案 1 :(得分:1)

由于您已经回答了自己的问题,我认为我会尝试将其尝试发布给其他可能会发现此问题并且不想使用PowerShell的人。它的所有延迟加载,因此在您拥有大型文件系统并匹配大量文件的情况下,它的性能将是最佳的。

样本使用:

string pattern = @"C:\Users\*\Source\Repos\*\*.cs";
foreach (var st in GetAllMatchingPaths(pattern))
    Console.WriteLine(st);

<强>解决方案:

public static IEnumerable<string> GetAllMatchingPaths(string pattern)
{
    char separator = Path.DirectorySeparatorChar;
    string[] parts = pattern.Split(separator);

    if (parts[0].Contains('*') || parts[0].Contains('?'))
        throw new ArgumentException("path root must not have a wildcard", nameof(parts));

    return GetAllMatchingPathsInternal(String.Join(separator.ToString(), parts.Skip(1)), parts[0]);
}

private static IEnumerable<string> GetAllMatchingPathsInternal(string pattern, string root)
{
    char separator = Path.DirectorySeparatorChar;
    string[] parts = pattern.Split(separator);

    for (int i = 0; i < parts.Length; i++)
    {
        // if this part of the path is a wildcard that needs expanding
        if (parts[i].Contains('*') || parts[i].Contains('?'))
        {
            // create an absolute path up to the current wildcard and check if it exists
            var combined = root + separator + String.Join(separator.ToString(), parts.Take(i));
            if (!Directory.Exists(combined))
                return new string[0];

            if (i == parts.Length - 1) // if this is the end of the path (a file name)
            {
                return Directory.EnumerateFiles(combined, parts[i], SearchOption.TopDirectoryOnly);
            }
            else // if this is in the middle of the path (a directory name)
            {
                var directories = Directory.EnumerateDirectories(combined, parts[i], SearchOption.TopDirectoryOnly);
                var paths = directories.SelectMany(dir =>
                    GetAllMatchingPathsInternal(String.Join(separator.ToString(), parts.Skip(i + 1)), dir));
                return paths;
            }
        }
    }

    // if pattern ends in an absolute path with no wildcards in the filename
    var absolute = root + separator + String.Join(separator.ToString(), parts);
    if (File.Exists(absolute))
        return new[] { absolute };

    return new string[0];
}

PS:它不会匹配目录,只会匹配文件,但如果需要,您可以轻松修改它。