我们的数据包含大约50亿条记录,并且将来每年至少会延续10亿条记录。最基本的对象是报价(产品销售)。每个商品都有一组数据,您可以在其中搜索它。像:
等。至少10个维度和2个维度需要全文搜索。并非所有这些都是最初可搜索的,但至少提供标题,类别,发行日期,卖方。现在,基础设施是一个强大的服务器(40核,256 GB RAM,一堆SSD),这些多维全搜索查询由弹性索引支持。现在查询对于WWW来说太慢了(平均接近10秒)。
一个基本问题是如何才能提高此类查询的效果?更详细的问题分为许多"子问题":
遗憾的是,我们的景色缺乏基础设施充裕的资金。现在我们有2台用于下载和处理数据的服务器和一台用于WWW应用的服务器。我们可以为WWW提供至少2台服务器。所以答案就像 - "你想要提高性能10倍 - 在20个其他服务器上复制你的数据"没用了。