为什么count(*)在一个PostgreSQL数据库中占用的时间非常长,而另一个则不然?

时间:2010-06-28 20:39:30

标签: postgresql count

我有两个Postgres数据库。在一个我有两个表,每个表有大约8,000,000行,并且其中任何一个的计数大约需要一秒钟。在另一个数据库中,也是Postgres,有些表是1,000,000行,计数需要10秒,一个表大约有6,000,000行,计数需要3分钟才能运行。哪些因素决定了这需要多长时间?它们位于不同的计算机上,但需要更长时间的数据库位于更快的计算机上。

我已经读到了一般来说postgres计数是如何缓慢的,但这对我来说似乎很奇怪。我无法真正使用解决方法,因为我正在使用django,它在管理员中进行了计数,这将永远占用并使其难以使用。

任何有关此信息都会有所帮助。

3 个答案:

答案 0 :(得分:4)

计数速度不仅取决于表中的行数,还取决于从磁盘读取数据所花费的时间。时间取决于很多事情:

  • 表格中的行数 - 正如您已经提到的那样。
  • 每页的记录数(如果每个记录需要更多空间,您需要阅读更多页面以读取相同数量的行)。
  • 如果页面只是部分填满,则必须阅读更多页面。
  • 如果表已经缓存在内存中(这里有更多可用内存有帮助)。
  • 如果表使用小索引编制索引(可以计算索引)。
  • 硬件差异。
  • 等...

答案 1 :(得分:0)

索引,缓存,磁盘速度,对于初学者都有影响。

答案 2 :(得分:0)

“慢表”是否正确吸尘?

使用VACUUM FULL,它只会创建表和索引膨胀。 VACUUM绝对够用。 VACUUM ANALYZE甚至会更好。

确保autovacuum已打开并正确配置