应用错误收集

500个搜索引擎索引，每个都需要计算。如何扩展？

时间：2016-08-09 18:28:15

标签： mysql elasticsearch indexing

我正在设计一个有500个索引的系统，每个索引都是基于具有数百万行的表的计算，我在表之间加入并执行各种相当复杂的逻辑，因此通常单个查询需要10个几分钟左右。我目前在mysql中这样做，我没有做任何并行的事情。因此，第一个指数计算需要10分钟，下一个指数需要10分钟，第三个指数需要10分钟，而第500个指数需要10分钟......这需要很长时间！

人们通常如何构建许多基于许多表和行的复杂计算的索引？他们只是并行做吗？他们会投入更多硬件吗？我可以遵循最佳实践吗？

2 个答案:

答案 0 :(得分：0)

这是Google的大查询旨在解决的问题。 https://cloud.google.com/bigquery/what-is-bigquery

答案 1 :(得分：0)

Shard-Query是并行执行MySQL查询的代码。

多字搜索会导致爆炸指数？
搜索引擎索引和类型
从全文搜索中删除索引
如何将搜索索引与MVC中的模型相关联？
需要SDK来查询谷歌高级搜索搜索计数
App Engine搜索：如何并行搜索多个搜索索引？
删除每500行后需要提交
500个搜索引擎索引，每个都需要计算。如何扩展？
Google App Engine搜索API（Python） - 搜索多个搜索索引
如何识别需要创建哪些索引

我写了这段代码，但我无法理解我的错误
我无法从一个代码实例的列表中删除 None 值，但我可以在另一个实例中。为什么它适用于一个细分市场而不适用于另一个细分市场？
是否有可能使 loadstring 不可能等于打印？卢阿
java中的random.expovariate()
Appscript 通过会议在 Google 日历中发送电子邮件和创建活动
为什么我的 Onclick 箭头功能在 React 中不起作用？
在此代码中是否有使用“this”的替代方法？
在 SQL Server 和 PostgreSQL 上查询，我如何从第一个表获得第二个表的可视化
每千个数字得到
更新了城市边界 KML 文件的来源？