如何在Azure表存储中进行自由文本搜索?

时间:2010-10-07 18:51:17

标签: azure azure-table-storage

我有一个Azure表存储的解决方案,每个客户(分区键)最多有几个tusands“行”。

如何最好地进行快速自由文本搜索?

由于数据的性质,我无法进行漏洞搜索(例如搜索“zur”应该匹配“Azure”)。

3 个答案:

答案 0 :(得分:4)

刚发现这可能会对您有所帮助:Azure Library for Lucene

答案 1 :(得分:4)

我们在网站的生产中使用以下内容:我们在http://websolr.com上运行托管solr(基于lucene)实例,并使用当前处于测试阶段的新azure分布式缓存功能缓存结果。这给了我们最糟糕的情况,即在运行websolr.com的亚马逊数据中心和Azure数据中心之间的初始搜索请求的200毫秒延迟,以及所有缓存搜索的平均6 - 10毫秒。我们还会记录常见的搜索文本片段,并尝试将它们保留在缓存中。

答案 2 :(得分:2)

目前没有开箱即用的解决方案。也许全功能搜索功能将在PDC10上公布。

所以目前您需要推出自己的文本索引解决方案。我这样做的方法是在worker角色上构建一个Lucene.net索引。然后,我在该worker角色上打开一个tcp端口,该端口使用WCF提供搜索服务。然后,任何Web角色都可以使用该服务。这非常有效,并提供非常快速的搜索服务。

Steve Marx的PDC09视频提供了更多信息:http://www.microsoftpdc.com/2009/SVC16