Azure搜索替代索引blob

时间:2017-08-14 09:16:24

标签: azure azure-search

是否有基于云的替代天蓝色搜索可以索引天蓝色斑点的内容? (主要是办公室文件)?

我有一个应用程序,它公开了很少使用的全文搜索。 Azure搜索适用于documentdb等,基本层涵盖了这种用法。

然而,当对blob应用索引时,如果每天搜索几次,那么与堆栈中使用的其他功能相比,成本非常高。

我们在存储方面也达到了2GB的限制,但在文件限制上却低于20%。理想情况下,我们希望增加存储空间,但如果不通过更新到S1而仅增加存储成本3倍,则无法实现这一目标。

到目前为止发现的替代品正在运行solr vm或构建我们自己的功能,这可能仍然需要VM,因此在这种情况下solr会更好。

似乎其他人在成本方面遇到了这个缩放问题,但通常是因为QPS。我们的QPS非常低,在24小时内进行了一些搜索。

::希望将其保留在Azure中。 AWS CloudSearch结算似乎适用于我们的用例

1 个答案:

答案 0 :(得分:1)

我是Azure搜索工程团队的成员。很抱歉听到定价不适合您。正如您所提到的,在Azure中运行您自己的SOLR或ElasticSearch实现当然是一种选择,但我怀疑您寻找Azure搜索的原因之一是您不希望将搜索管理添加到您的解决方案中。

如果没有具体了解您的目标,很难进入特定的选项(例如,您只是对此内容进行全文搜索,还是进行更多,如分面,过滤等)。让我抛出一个选项。

可以减少内容大小吗?例如,您是否真的需要在Azure搜索中包含所有这些内容,或者您​​是否可以说从这些内容中索引关键术语和短语,以便您可以识别包含您要查找的术语的文档?有许多伟大的技术(如Word2Vec)非常适合提取术语和短语。

这样做的另一个好处是这些术语也可用于分面和过滤,然后您可以根据需要简单地从其他商店加载完整内容。

术语提取的缺点可能不包括您认为重要的一些术语。

还有很多其他选择,但如果我更了解你想要做什么,也许我可以提供更多帮助。

利安

相关问题