应用错误收集

为什么count（*）在一个PostgreSQL数据库中占用的时间非常长，而另一个则不然？

时间：2010-06-28 20:39:30

标签： postgresql count

我有两个Postgres数据库。在一个我有两个表，每个表有大约8,000,000行，并且其中任何一个的计数大约需要一秒钟。在另一个数据库中，也是Postgres，有些表是1,000,000行，计数需要10秒，一个表大约有6,000,000行，计数需要3分钟才能运行。哪些因素决定了这需要多长时间？它们位于不同的计算机上，但需要更长时间的数据库位于更快的计算机上。

我已经读到了一般来说postgres计数是如何缓慢的，但这对我来说似乎很奇怪。我无法真正使用解决方法，因为我正在使用django，它在管理员中进行了计数，这将永远占用并使其难以使用。

任何有关此信息都会有所帮助。

3 个答案:

答案 0 :(得分：4)

计数速度不仅取决于表中的行数，还取决于从磁盘读取数据所花费的时间。时间取决于很多事情：

表格中的行数 - 正如您已经提到的那样。
每页的记录数（如果每个记录需要更多空间，您需要阅读更多页面以读取相同数量的行）。
如果页面只是部分填满，则必须阅读更多页面。
如果表已经缓存在内存中（这里有更多可用内存有帮助）。
如果表使用小索引编制索引（可以计算索引）。
硬件差异。
等...

答案 1 :(得分：0)

索引，缓存，磁盘速度，对于初学者都有影响。

答案 2 :(得分：0)

“慢表”是否正确吸尘？

不使用VACUUM FULL，它只会创建表和索引膨胀。 VACUUM绝对够用。 VACUUM ANALYZE甚至会更好。

确保autovacuum已打开并正确配置