我想在字符串列表上实现增量搜索。考虑我有一个包含字符串存储,状态,戳记,爬行,乌鸦的数组。我的应用程序有一个文本框,用户可在其中输入搜索字符串。现在,当用户输入文本时,我需要突出显示所有匹配项。例如,当用户输入“st”时,我需要突出显示“存储,状态,戳记”,当他键入“a”时,我需要从列表中删除“存储”。我正在使用c#开发应用程序.net框架。我打算做的是,在文本发生变化的事件上,我在后台搜索并显示结果。还有其他方法可以解决这个问题吗?
答案 0 :(得分:6)
你可以看看新输入的信件;如果新的第三个字母是'a',则只丢弃所有在第三个位置没有'a'的元素。如果用户删除了一封信,则必须重新扫描整个原始列表,并将所有已删除的项目带回。
但是,如果用户从剪贴板中粘贴多个字母,通过选择它们删除多个字母,在中间某处插入或删除一个或多个字母会怎么样?
您需要注意很多情况。如果搜索文本以不同于添加单个字母的方式更改,您可以使用新输入的字母进行完全重新扫描的方法,但即使这个简单的方法可能不值得努力,只是为了避免几十或百字串比较。如前所述,如果您拥有非常大的数据集或想要非常快速,那么Trie或Patricia trie就是您的选择。
答案 1 :(得分:4)
我过去必须做类似的事情,使用一个包含大约500,000个单词的集合。我发现directed acyclic word graph效果很好。 DAWG与trie的性能大致相同,但空间效率更高。然而,实施起来稍微复杂一些。
不幸的是,我的工作是在C中,我没有很好的参考C#中的DAWG实现。
答案 2 :(得分:2)
如果您的列表可以增长到显着长度(超过数百个条目),则trie data structure可以很好地扩展。查看例如this example implementation。
答案 3 :(得分:0)
下面是一个函数,它将逐步搜索字符串以查找匹配的子字符串。
public IEnumerable<int> FindAllMatches(string toMatch, string source) {
var last = 0;
do {
var cur = source.IndexOf(toMatch,last);
if ( cur < 0 ) {
break;
}
yield return cur;
last = cur + toMatch.Length;
while(true);
}
答案 4 :(得分:0)
您可以使用泛型集合代替字符串数组。这样,您可以将FindAll方法与委托一起使用来搜索项目。
string searchString = "s";
List<string> sl = new List<string>();
sl.Add("store");
sl.Add("state");
sl.Add("stamp");
sl.Add("crawl");
sl.Add("crow");
List<string> searchResults = sl.FindAll(delegate(string match)
{
return match.StartsWith(searchString, StringComparison.CurrentCultureIgnoreCase);
});
答案 5 :(得分:0)
...哇
只需在文本框中使用内置的自动完成功能即可。你可以提供你的单词列表,它会为你做匹配。
答案 6 :(得分:0)
好吧,我已经针对这个问题实施了一个Trie和一个DAWG,我偶然发现了两个头部问题:
1)DAWG - &gt;定向 ACYCLIC Word Graph。你如何用'bot'和'boot'这样的词来创建这个图形/遍历它,启动时'oo'会导致基于DAWG的循环 2)Trie消除了这个问题,但随后引入了一些分支管理问题。
构建图形比使用它生成所需单词更容易(IMO),而不会产生更多的运行时间。
我还在努力。