有“额外”的数据库查询有多糟糕?

时间:2016-04-02 02:25:51

标签: mysql database coldfusion database-performance lucee

我来自Web开发的前端世界,我们非常努力地限制发出的HTTP请求数量(通过合并css,js文件,图像等)。

使用数据库连接(MySQL),显然你不希望有不必要的连接,但作为一般规则,有多个小查询有多糟糕? (他们快速执行)

我问,因为我正在将我的应用程序移动到集群环境中以及在我在服务器内存中缓存某些内容之前(因为我在单个服务器上运行),我现在正试图使我的应用程序“无状态”并且在我当前的实现中,这意味着更多的小型db调用。这将有助于我实现负载平衡(避免粘性会话)并降低服务器内存使用率。

我们不是在谈论大量的查询,可能是6-8分贝而不是2-4分,从少量记录返回到几千条记录。它们中的每一个都快速执行,不到30ms(一些更少),但我不知道是否存在一些我应该关注的“连接延迟”。

感谢您的见解。

2 个答案:

答案 0 :(得分:6)

简短回答:(1)确保你保持在同一个大O级别,重用连接,衡量绩效; (2)考虑你对数据一致性的关注程度。

答案很长:

<强>性能

严格来说,从性能角度来看,一般来说,除非您已经接近最大化数据库资源(例如最大连接数),否则这不太可能产生重大影响。但是你应该记住一些事情:

  • 执行替换“2-4”查询的“6-8”查询是否保持相同的执行时间?例如如果当前数据库交互位于O(1),它是否会更改为O(n)?或者当前O(n)会更改为O(n^2)?如果是,您应该考虑这对您的申请意味着什么
  • 大多数应用程序服务器可以重用现有数据库连接,或者拥有持久数据库连接池;确保您的应用程序不为每个查询建立新连接;否则这将使其效率更低
  • 在许多常见情况下,主要是在具有复杂索引和连接的较大表上,通过主键执行少量查询可能比在单个查询中连接这些表更有效;如果在执行此类连接时,服务器不仅需要更长时间来执行复杂查询,而且还会阻止针对受影响表的其他查询

一般而言,关于绩效,经验法则是 - 始终衡量。

<强>一致性

然而,性能不是唯一需要考虑的方面。还要考虑您对应用程序中数据一致性的关注程度。

例如,考虑一个简单的情况 - 表AB具有一对一关系,并且您使用主键查询单个记录。如果您使用单个查询连接这些表并检索结果,您将从AB获取记录,或者从两者中都没有记录,这也是您的应用程序所期望的。现在考虑是否将其拆分为2个查询(并且您没有使用具有首选隔离级别的事务) - 您从表A获取记录,但在获取表{{1}中的匹配记录之前},它被另一个进程删除/更新。现在,您的应用程序的记录来自B,但没有来自A

这里的一般问题是 - 您是否关心您的关系数据的ACID合规性,因为它与您正在分离的查询有关?如果答案是肯定的,那么您必须考虑应用程序逻辑在这些特定情况下的反应。

答案 1 :(得分:4)

一个网页的6-8个查询?通常这很好。我一直这样做。

数千行返回?呛!客户与这么多人有什么关系? SQL可以进行更多处理,然后返回更少的行吗?

除少数例外情况外,每个网页只有1个连接。

每个查询都有很多开销。例如,表中的INSERTing 100行 - 100个INSERT单行语句所需的时间约为单行100行INSERT的10倍。所以实用时使用更少的往返服务器。如果网络是WAN,这变得非常重要。地球的另一边距离250米,只是为了延迟。同一数据中心中的服务器可能非常接近,可以忽略延迟。在WAN中,使用存储例程来最小化往返。

我喜欢在代码中主动为每个查询计时。然后,如果我发现性能问题,我会先查看哪个查询可以解决。或者使用SlowLog。