有什么办法可以显着提高这个文件搜索的效率吗?

时间:2013-01-23 20:53:45

标签: java recursion file-search

此方法使用递归来查找名称中包含特定字符串的文件。它正在网络驱动器上搜索,有时必须搜索数百甚至数千个目录才能找到它正在寻找的内容。它相当慢 - 有时需要5-10秒。我怀疑延迟是由网络连接引起的,因为这个网络对其他一切都非常快。无论如何,这只是我掀起的东西,所以可能会有更高效的东西。

public static File findFile(File root, String name)
{
    File [] dir = root.listFiles();
    File a = null;

    for(int i = 0; i < dir.length; i++)
    {
        if(dir[i].isDirectory() && a == null)
            a = findFile(dir[i],name);
        else if(dir[i].getName().indexOf(name) > -1)
            return dir[i];
    }

    return a;
}

那么有什么方法可以改善这个吗?或者是搜索许多目录的过程几乎总是那么慢?感谢。

2 个答案:

答案 0 :(得分:1)

这可能有点矫枉过正,但考虑建立一个index

我个人曾经使用Apache Lucene来索引各种网络资产,包括图像文件,PDF,HTML等。使用Lucene 4.1,添加到索引以及搜索索引是令人难以置信的简单。

将文件夹(及所有子文件夹)添加到索引

首先,将网络驱动器中的所有内容添加到索引中非常简单:

  

java org.apache.lucene.demo.IndexFiles -docs {path-to-folder}

搜索索引

一旦添加了索引所需的所有文件,就可以使用Lucene库提供的搜索索引器来搜索文档:

IndexSearcher.search(query, n)

配置有无限可能,您不仅限于搜索文件名。

答案 1 :(得分:0)

在大型目录结构中,搜索需要更长时间。如果您需要速度,请考虑基于索引的方法(构造并动态更新文件名索引,并仅在其中进行查找)。

这正是Linux locate命令的工作原理,它的搜索是即时的。