你可以使用多个过滤器调用Directory.GetFiles()吗?

时间:2008-10-02 15:58:21

标签: c# filesystems .net

我正在尝试使用Directory.GetFiles()方法检索多种类型的文件列表,例如mp3jpg。我尝试了以下两种方法但没有运气:

Directory.GetFiles("C:\\path", "*.mp3|*.jpg", SearchOption.AllDirectories);
Directory.GetFiles("C:\\path", "*.mp3;*.jpg", SearchOption.AllDirectories);

有没有办法在一次通话中这样做?

27 个答案:

答案 0 :(得分:473)

对于.NET 4.0及更高版本,

var files = Directory.EnumerateFiles("C:\\path", "*.*", SearchOption.AllDirectories)
            .Where(s => s.EndsWith(".mp3") || s.EndsWith(".jpg"));

对于早期版本的.NET,

var files = Directory.GetFiles("C:\\path", "*.*", SearchOption.AllDirectories)
            .Where(s => s.EndsWith(".mp3") || s.EndsWith(".jpg"));

编辑 请阅读评论。 Paul Farry建议的改进以及Christian.K指出的内存/性能问题都非常重要。

答案 1 :(得分:52)

这个怎么样:

private static string[] GetFiles(string sourceFolder, string filters, System.IO.SearchOption searchOption)
{
   return filters.Split('|').SelectMany(filter => System.IO.Directory.GetFiles(sourceFolder, filter, searchOption)).ToArray();
}

我在这里(在评论中)找到了它:http://msdn.microsoft.com/en-us/library/wz42302f.aspx

答案 2 :(得分:29)

答案 3 :(得分:27)

var exts = new[] { "mp3", "jpg" };

你可以:

public IEnumerable<string> FilterFiles(string path, params string[] exts) {
    return
        Directory
        .EnumerateFiles(path, "*.*")
        .Where(file => exts.Any(x => file.EndsWith(x, StringComparison.OrdinalIgnoreCase)));
}

但是,当您拆分过滤器并合并结果时,EnumerateFiles的真正好处就出现了:

public IEnumerable<string> FilterFiles(string path, params string[] exts) {
    return 
        exts.Select(x => "*." + x) // turn into globs
        .SelectMany(x => 
            Directory.EnumerateFiles(path, x)
            );
}

如果您不必将它们变为全局(例如exts = new[] {"*.mp3", "*.jpg"}),它会更快一点。

基于以下LinqPad测试的性能评估(注意:Perf只重复委托10000次) https://gist.github.com/zaus/7454021

(从'重复'转发并扩展,因为该问题明确要求没有LINQ:Multiple file-extensions searchPattern for System.IO.Directory.GetFiles

答案 4 :(得分:15)

我知道这是一个老问题,但是LINQ :( .NET40 +)

var files = Directory.GetFiles("path_to_files").Where(file => Regex.IsMatch(file, @"^.+\.(wav|mp3|txt)$"));

答案 5 :(得分:11)

使用Linq的另一种方法,但无需返回所有内容并在内存中对其进行过滤。

var files = Directory.GetFiles("C:\\path", "*.mp3", SearchOption.AllDirectories).Union(Directory.GetFiles("C:\\path", "*.jpg", SearchOption.AllDirectories));

它实际上是对GetFiles()的两次调用,但我认为它与问题的精神一致并将它们归还给一个可枚举的。

答案 6 :(得分:10)

还有一种下降解决方案似乎没有任何内存或性能开销,并且非常优雅:

string[] filters = new[]{"*.jpg", "*.png", "*.gif"};
string[] filePaths = filters.SelectMany(f => Directory.GetFiles(basePath, f)).ToArray();

答案 7 :(得分:7)

不。请尝试以下方法:

List<string> _searchPatternList = new List<string>();
    ...
    List<string> fileList = new List<string>();
    foreach ( string ext in _searchPatternList )
    {
        foreach ( string subFile in Directory.GetFiles( folderName, ext  )
        {
            fileList.Add( subFile );
        }
    }

    // Sort alpabetically
    fileList.Sort();

    // Add files to the file browser control    
    foreach ( string fileName in fileList )
    {
        ...;
    }

取自:http://blogs.msdn.com/markda/archive/2006/04/20/580075.aspx

答案 8 :(得分:6)

var set = new HashSet<string> { ".mp3", ".jpg" };

然后

Directory.GetFiles(path, "*.*", SearchOption.AllDirectories)
         .Where(f => set.Contains(
             new FileInfo(f).Extension,
             StringComparer.OrdinalIgnoreCase));

from file in Directory.GetFiles(path, "*.*", SearchOption.AllDirectories)
from ext in set
where String.Equals(ext, new FileInfo(file).Extension, StringComparison.OrdinalIgnoreCase)
select file;

答案 9 :(得分:5)

我不能使用.Where方法,因为我在.NET Framework 2.0中编程(Linq仅在.NET Framework 3.5+中受支持)。

以下代码不区分大小写(因此也会列出.CaB.cab)。

string[] ext = new string[2] { "*.CAB", "*.MSU" };

foreach (string found in ext)
{
    string[] extracted = Directory.GetFiles("C:\\test", found, System.IO.SearchOption.AllDirectories);

    foreach (string file in extracted)
    {
        Console.WriteLine(file);
    }
}

答案 10 :(得分:4)

List<string> FileList = new List<string>();
DirectoryInfo di = new DirectoryInfo("C:\\DirName");

IEnumerable<FileInfo> fileList = di.GetFiles("*.*");

//Create the query
IEnumerable<FileInfo> fileQuery = from file in fileList
                                  where (file.Extension.ToLower() == ".jpg" || file.Extension.ToLower() == ".png")
                                  orderby file.LastWriteTime
                                  select file;

foreach (System.IO.FileInfo fi in fileQuery)
{
    fi.Attributes = FileAttributes.Normal;
    FileList.Add(fi.FullName);
}

答案 11 :(得分:4)

以下函数搜索多个模式,以逗号分隔。您还可以指定排除项,例如:“!web.config”将搜索所有文件并排除“web.config”。模式可以混合。

private string[] FindFiles(string directory, string filters, SearchOption searchOption)
{
    if (!Directory.Exists(directory)) return new string[] { };

    var include = (from filter in filters.Split(new char[] { ',' }, StringSplitOptions.RemoveEmptyEntries) where !string.IsNullOrEmpty(filter.Trim()) select filter.Trim());
    var exclude = (from filter in include where filter.Contains(@"!") select filter);

    include = include.Except(exclude);

    if (include.Count() == 0) include = new string[] { "*" };

    var rxfilters = from filter in exclude select string.Format("^{0}$", filter.Replace("!", "").Replace(".", @"\.").Replace("*", ".*").Replace("?", "."));
    Regex regex = new Regex(string.Join("|", rxfilters.ToArray()));

    List<Thread> workers = new List<Thread>();
    List<string> files = new List<string>();

    foreach (string filter in include)
    {
        Thread worker = new Thread(
            new ThreadStart(
                delegate
                {
                    string[] allfiles = Directory.GetFiles(directory, filter, searchOption);
                    if (exclude.Count() > 0)
                    {
                        lock (files)
                            files.AddRange(allfiles.Where(p => !regex.Match(p).Success));
                    }
                    else
                    {
                        lock (files)
                            files.AddRange(allfiles);
                    }
                }
            ));

        workers.Add(worker);

        worker.Start();
    }

    foreach (Thread worker in workers)
    {
        worker.Join();
    }

    return files.ToArray();

}

用法:

foreach (string file in FindFiles(@"D:\628.2.11", @"!*.config, !*.js", SearchOption.AllDirectories))
            {
                Console.WriteLine(file);
            }

答案 12 :(得分:3)

怎么样?
string[] filesPNG = Directory.GetFiles(path, "*.png");
string[] filesJPG = Directory.GetFiles(path, "*.jpg");
string[] filesJPEG = Directory.GetFiles(path, "*.jpeg");

int totalArraySizeAll = filesPNG.Length + filesJPG.Length + filesJPEG.Length;
List<string> filesAll = new List<string>(totalArraySizeAll);
filesAll.AddRange(filesPNG);
filesAll.AddRange(filesJPG);
filesAll.AddRange(filesJPEG);

答案 13 :(得分:3)

刚刚找到了另一种方法。仍然不是一个操作,而是抛出它看看别人怎么想。

private void getFiles(string path)
{
    foreach (string s in Array.FindAll(Directory.GetFiles(path, "*", SearchOption.AllDirectories), predicate_FileMatch))
    {
        Debug.Print(s);
    }
}

private bool predicate_FileMatch(string fileName)
{
    if (fileName.EndsWith(".mp3"))
        return true;
    if (fileName.EndsWith(".jpg"))
        return true;
    return false;
}

答案 14 :(得分:3)

DirectoryInfo directory = new DirectoryInfo(Server.MapPath("~/Contents/"));

//Using Union

FileInfo[] files = directory.GetFiles("*.xlsx")
                            .Union(directory
                            .GetFiles("*.csv"))
                            .ToArray();

答案 15 :(得分:2)

Nop ...我相信你必须拨打你想要的文件类型。

我会自己创建一个函数,在带有我需要的扩展的字符串上取一个数组,然后迭代该数组,进行所有必要的调用。该函数将返回与我发送的扩展名匹配的文件的通用列表。

希望它有所帮助。

答案 16 :(得分:2)

.NET 2.0中的

(没有Linq):

public static List<string> GetFilez(string path, System.IO.SearchOption opt,  params string[] patterns)
{
    List<string> filez = new List<string>();
    foreach (string pattern in patterns)
    {
        filez.AddRange(
            System.IO.Directory.GetFiles(path, pattern, opt)
        );
    }


    // filez.Sort(); // Optional
    return filez; // Optional: .ToArray()
}

然后使用它:

foreach (string fn in GetFilez(path
                             , System.IO.SearchOption.AllDirectories
                             , "*.xml", "*.xml.rels", "*.rels"))
{}

答案 17 :(得分:2)

将扩展名设为一个字符串,即“.mp3.jpg.wma.wmf”,然后检查每个文件是否包含所需的扩展名。 这适用于.net 2.0,因为它不使用LINQ。

string myExtensions=".jpg.mp3";

string[] files=System.IO.Directory.GetFiles("C:\myfolder");

foreach(string file in files)
{
   if(myExtensions.ToLower().contains(System.IO.Path.GetExtension(s).ToLower()))
   {
      //this file has passed, do something with this file

   }
}

这种方法的优点是你可以在不编辑代码的情况下添加或删除扩展名,即添加png图像,只需编写myExtensions =“。jpg.mp3.png”。

答案 18 :(得分:2)

/// <summary>
/// Returns the names of files in a specified directories that match the specified patterns using LINQ
/// </summary>
/// <param name="srcDirs">The directories to seach</param>
/// <param name="searchPatterns">the list of search patterns</param>
/// <param name="searchOption"></param>
/// <returns>The list of files that match the specified pattern</returns>
public static string[] GetFilesUsingLINQ(string[] srcDirs,
     string[] searchPatterns,
     SearchOption searchOption = SearchOption.AllDirectories)
{
    var r = from dir in srcDirs
            from searchPattern in searchPatterns
            from f in Directory.GetFiles(dir, searchPattern, searchOption)
            select f;

    return r.ToArray();
}

答案 19 :(得分:1)

我想知道为什么会发布这么多“解决方案”?

如果我的新手对GetFiles的工作原理是正确的,那么只有两个选项,上面的任何解决方案都可以归结为:

  1. GetFiles,然后过滤:快速,但由于存储开销而导致内存杀手,直到应用过滤器

  2. GetFiles过滤:设置的过滤器越多,但内存使用率越低,因为没有存储开销。
    上面的一篇文章解释了这一点,其中有一个令人印象深刻的基准:每个过滤器选项会导致单独的GetFile操作,因此硬盘的相同部分会被多次读取。

  3. 在我看来,选项1)更好,但在C:\等文件夹上使用SearchOption.AllDirectories会占用大量内存。
    因此,我将使用选项1)

    创建一个遍历所有子文件夹的递归子方法

    这应该只对每个文件夹产生1个GetFiles操作,因此速度很快(选项1),但只使用少量内存,因为在每个子文件夹的读取后应用过滤器 - &gt;每个子文件夹后删除开销。

    如果我错了,请纠正我。我正如我对编程所说的那么新,但是想要更深入地理解事物以最终变得擅长:)

答案 20 :(得分:1)

我遇到了同样的问题,无法找到合适的解决方案,所以我编写了一个名为GetFiles的函数:

/// <summary>
/// Get all files with a specific extension
/// </summary>
/// <param name="extensionsToCompare">string list of all the extensions</param>
/// <param name="Location">string of the location</param>
/// <returns>array of all the files with the specific extensions</returns>
public string[] GetFiles(List<string> extensionsToCompare, string Location)
{
    List<string> files = new List<string>();
    foreach (string file in Directory.GetFiles(Location))
    {
        if (extensionsToCompare.Contains(file.Substring(file.IndexOf('.')+1).ToLower())) files.Add(file);
    }
    files.Sort();
    return files.ToArray();
}

此功能只会调用Directory.Getfiles()一次。

例如,调用这样的函数:

string[] images = GetFiles(new List<string>{"jpg", "png", "gif"}, "imageFolder");

编辑:要获得一个包含多个扩展名的文件,请使用以下文件:

/// <summary>
    /// Get the file with a specific name and extension
    /// </summary>
    /// <param name="filename">the name of the file to find</param>
    /// <param name="extensionsToCompare">string list of all the extensions</param>
    /// <param name="Location">string of the location</param>
    /// <returns>file with the requested filename</returns>
    public string GetFile( string filename, List<string> extensionsToCompare, string Location)
    {
        foreach (string file in Directory.GetFiles(Location))
        {
            if (extensionsToCompare.Contains(file.Substring(file.IndexOf('.') + 1).ToLower()) &&& file.Substring(Location.Length + 1, (file.IndexOf('.') - (Location.Length + 1))).ToLower() == filename) 
                return file;
        }
        return "";
    }

例如,调用这样的函数:

string image = GetFile("imagename", new List<string>{"jpg", "png", "gif"}, "imageFolder");

答案 21 :(得分:1)

这是获取过滤文件的简单而优雅的方法

var allowedFileExtensions = ".csv,.txt";


var files = Directory.EnumerateFiles(@"C:\MyFolder", "*.*", SearchOption.TopDirectoryOnly)
                .Where(s => allowedFileExtensions.IndexOf(Path.GetExtension(s)) > -1).ToArray(); 

答案 22 :(得分:0)

我不知道哪种解决方案更好,但我使用它:

simple

答案 23 :(得分:0)

如果您正在使用VB.NET(或将依赖项导入您的C#项目),实际上存在一种允许过滤多个扩展的便捷方法:

Microsoft.VisualBasic.FileIO.FileSystem.GetFiles("C:\\path", Microsoft.VisualBasic.FileIO.SearchOption.SearchAllSubDirectories, new string[] {"*.mp3", "*.jpg"});

在VB.NET中,可以通过My-namespace访问:

My.Computer.FileSystem.GetFiles("C:\path", FileIO.SearchOption.SearchAllSubDirectories, {"*.mp3", "*.jpg"})

不幸的是,这些便利方法并不支持像Directory.EnumerateFiles()这样的懒惰评估变体。

答案 24 :(得分:0)

使用GetFiles搜索模式来过滤扩展名是不安全的! 例如,您有两个文件Test1.xls和Test2.xlsx,并且要使用搜索模式* .xls过滤出xls文件,但是GetFiles会同时返回Test1.xls和Test2.xlsx 我不知道这一点,并且在生产环境中出现错误,因为一些临时文件突然被当作正确文件处理。搜索模式为* .txt,临时文件名为* .txt20181028_100753898 因此,无法信任搜索模式,您还必须在文件名上添加额外的检查。

答案 25 :(得分:-1)

或者您可以将扩展字符串转换为String ^

vector <string>  extensions = { "*.mp4", "*.avi", "*.flv" };
for (int i = 0; i < extensions.size(); ++i)
{
     String^ ext = gcnew String(extensions[i].c_str());;
     String^ path = "C:\\Users\\Eric\\Videos";
     array<String^>^files = Directory::GetFiles(path,ext);
     Console::WriteLine(ext);
     cout << " " << (files->Length) << endl;
}

答案 26 :(得分:-2)

希望这对某人有帮助

//getting only playable Audio/Video Files from open dialog

OpenFileDialog dlg = new OpenFileDialog();

dlg.Filter = ""All Media Files|*.wav;*.aac;*.wma;*.wmv;*.avi;*.mpg;*.mpeg;*.m1v;*.mp2;*.mp3;*.mpa;*.mpe;*.m3u;*.mp4;*.mov;*.3g2;*.3gp2;*.3gp;*.3gpp;*.m4a;*.cda;*.aif;*.aifc;*.aiff;*.mid;*.midi;*.rmi;*.mkv;*.WAV;*.AAC;*.WMA;*.WMV;*.AVI;*.MPG;*.MPEG;*.M1V;*.MP2;*.MP3;*.MPA;*.MPE;*.M3U;*.MP4;*.MOV;*.3G2;*.3GP2;*.3GP;*.3GPP;*.M4A;*.CDA;*.AIF;*.AIFC;*.AIFF;*.MID;*.MIDI;*.RMI;*.MKV";

dlg.ShowDialog();