也许每周一次,我会观察到一连串的ColdFusion错误,这些错误表示“通过对等方重置连接”或“尝试建立连接超时”。然后一切都恢复正常,没有我或我的DBA干预。
这似乎不是一个网络问题。不依赖SQL的网页服务得很好。
事件期间SQL内存激增。
我想弄明白为什么。我的职责是前端Web开发,但我的DBA还没有帮助。我希望有一些关于从哪里开始的建议。
我想知道: 在其中一个事件发生时,SQL中运行了哪些查询? 是否存在一个对服务器过度征税的重大问题? 一堆小家伙? 某些表是否被重新编入索引?是否有其他进程占用服务器?
使用CF的SQL监视工具,我看到几个轻量级查询需要500秒才能执行。也许这些都是症状而不是原因。例如:
INSERT INTO [Our Request Log] (X,Y,Z) VALUES (?,?,NULL)
SELECT IDENT_CURRENT('[Our Request Log]') AS 'LastInsertedIdentity',
@@ROWCOUNT AS 'RowsAffectedCount'
我相信我应该使用SQL Profiler调查这种情况,我之前没有使用过它。
但是我担心分析会对我们的生产服务器造成负担。我在dev上测试,除了在100多个Web应用程序中有1000个查询 - 我不能单独测试每个。此外,我们的问题似乎很可能源于一系列问题而不是单一查询。
有什么建议吗?
我们的配置