Question

我正在搜索网络文件中的特定文字。用户输入文本。我要搜索大约850个文件。下面的代码完成了我想要的但是大约需要11-13秒。此代码位于我使用$ .ajax GET从网页调用的Web服务中。有没有办法可以改进代码，以便搜索速度更快？或者我应该查看其他区域而不是我的代码？

我在文档中进行了替换，因为文件是如何创建的（他们使用MS Word创建Web文件......另一场战斗）并且它改善了我的搜索结果。

var searchResults = new StringBuilder();

var parameters = searchParameters.Split('|');

var searchOnCompletePhrase = bool.Parse(parameters[1]);

var completePhrasePattern = @"\b(?:" + Regex.Escape(parameters[0].ToString()) + @")\b";

var files = Directory.GetFiles(path, "*.htm");

if (searchOnCompletePhrase && searchPhrase.Length > 1)
{
    foreach (var currentFile in files)
    {
        document.Load(currentFile);

        contents = document.DocumentNode.InnerText.Replace("\r", string.Empty)
            .Replace("\n", string.Empty)
            .Replace("&nbsp;", string.Empty)
            .Replace("  ", " ");

        if (contents.ToLower().IndexOf(searchPhrase.ToLower()) > -1)
        {
            searchResults.AppendLine(currentFile);

            searchResults.Append("|");
        }
    }
}
else
{
    var keywords = parameters[0].Split(' ');

    foreach (var currentFile in files)
    {
        document.Load(currentFile);

        contents = document.DocumentNode.InnerText.Replace("\r", string.Empty)
            .Replace("\n", string.Empty)
            .Replace("&nbsp;", string.Empty)
            .Replace("  ", " ");

        var found = true;

        foreach (var word in keywords)
        {
            if (!SearchCurrentWord(word.ToString()))
            {
                found = false;

                break;
            }
        }

        if (found)
        {
            searchResults.AppendLine(currentFile);

            searchResults.Append("|");
        }
    }
}

Answer 1

也许您应该尝试使用Parallel.Foreach而不是foreach循环来避免顺序等待磁盘中的每个文件。

搜索文件内容的最快方法

1 个答案: