估计大型SQL查询中的值

时间:2017-11-23 16:12:51

标签: sql sql-server

我正在开展一个项目,使用抽样方法估算大型数据集,例如,在1,000,000行的数据集中,使用随机抽样来找到更快的行的AVERAGE估算值。开始搞乱这个问题的最佳位置是SQL查询,还是用SQL编写?或者我应该考虑直接在SQL插件或其他东西中构建实现?我想自己做实际的工作,所以我主要是朝着正确的方向寻找一个点。谢谢你们!

1 个答案:

答案 0 :(得分:1)

既然你没有提供RDBMS实现,而SQL是基本标准......我会分享PostgreSQL的想法。也许这可以用于其他人。每个表索引都有统计信息。因此,您可以推断出什么是平均值,或者有多少条目。这不精确,但比随机抽样更好。

作为旁注,1M行并不多。