我有一个Azure表存储的解决方案,每个客户(分区键)最多有几个tusands“行”。
如何最好地进行快速自由文本搜索?
由于数据的性质,我无法进行漏洞搜索(例如搜索“zur”应该匹配“Azure”)。
答案 0 :(得分:4)
刚发现这可能会对您有所帮助:Azure Library for Lucene
答案 1 :(得分:4)
我们在网站的生产中使用以下内容:我们在http://websolr.com上运行托管solr(基于lucene)实例,并使用当前处于测试阶段的新azure分布式缓存功能缓存结果。这给了我们最糟糕的情况,即在运行websolr.com的亚马逊数据中心和Azure数据中心之间的初始搜索请求的200毫秒延迟,以及所有缓存搜索的平均6 - 10毫秒。我们还会记录常见的搜索文本片段,并尝试将它们保留在缓存中。
答案 2 :(得分:2)
目前没有开箱即用的解决方案。也许全功能搜索功能将在PDC10上公布。
所以目前您需要推出自己的文本索引解决方案。我这样做的方法是在worker角色上构建一个Lucene.net索引。然后,我在该worker角色上打开一个tcp端口,该端口使用WCF提供搜索服务。然后,任何Web角色都可以使用该服务。这非常有效,并提供非常快速的搜索服务。
Steve Marx的PDC09视频提供了更多信息:http://www.microsoftpdc.com/2009/SVC16