上周我们已经执行了Windows补丁活动,在Windows补丁之后,我们确认SQL服务器上的一切正常。 所有数据库均可访问,所有数据库均为ONLINE。 所有SQL Server服务都已启动并正在运行。 SQL Server代理也很好。
然后我们在寻找最新的数据库备份。即使有相同的维护计划,我们也找不到任何备份。
所以我们决定做一个RCA为什么服务器上没有发生预定的备份? 我们开始检查SQL Server错误日志/ Windows日志/应用程序日志,但找不到任何内容。
最后,当检查SQL Server代理的日志时,我们发现其中的以下错误连续3天重复:
[393]等待SQL Server恢复数据库'msdb'...... [298] SQLServer错误:16389,通信链接失败[SQLSTATE 08S01] (ConnCheckIfDBIsOnline)[298] SQLServer错误:10004,通信 链接失败[SQLSTATE 08S01](ConnCheckIfDBIsOnline)[298] SQLServer 错误:16389,通讯链接失败[SQLSTATE 08S01] (ConnCheckIfDBIsOnline)[393]等待SQL Server恢复 database'msdb'... [298] SQLServer错误:16389,通讯链接 失败[SQLSTATE 08S01](ConnCheckIfDBIsOnline)[298] SQLServer 错误:10004,通讯链接失败[SQLSTATE 08S01] (ConnCheckIfDBIsOnline)[298] SQLServer错误:16389,通信 链接失败[SQLSTATE 08S01](ConnCheckIfDBIsOnline)[393]等待 用于SQL Server恢复数据库'msdb'... [298] SQLServer错误: 16389,通讯链接失败[SQLSTATE 08S01] (ConnCheckIfDBIsOnline)[298] SQLServer错误:10004,通信 链接失败[SQLSTATE 08S01](ConnCheckIfDBIsOnline)[298] SQLServer 错误:16389,通讯链接失败[SQLSTATE 08S01] (ConnCheckIfDBIsOnline)[393]等待SQL Server恢复 database'msdb'... [298] SQLServer错误:16389,通讯链接 失败[SQLSTATE 08S01](ConnCheckIfDBIsOnline)[298] SQLServer 错误:10004,通讯链接失败[SQLSTATE 08S01] (ConnCheckIfDBIsOnline)[298] SQLServer错误:16389,通信 链接失败[SQLSTATE 08S01](ConnCheckIfDBIsOnline)[393]等待 用于SQL Server恢复数据库'msdb'... [298] SQLServer错误: 16389,通讯链接失败[SQLSTATE 08S01] (ConnCheckIfDBIsOnline)[298] SQLServer错误:233,通信链接 失败[SQLSTATE 08S01](ConnCheckIfDBIsOnline)[298] SQLServer 错误:233,共享内存提供程序:没有进程在另一端 管道。 [SQLSTATE 08S01](ConnCheckIfDBIsOnline)[393]等待 SQL Server恢复数据库'msdb'...
我的机器详细信息如下:
Windows服务器:Windows Server 2016
SQL Server版本: Microsoft SQL Server 2016(SP1)(KB3182545) - 13.0.4001.0(X64)2016年10月28日18:17:30版权所有(c)Microsoft Corporation
Windows Server 2016 Datacenter 6.3上的标准版(64位)(Build 14393:)(管理程序)
任何人都可以告诉我们为什么SQL Server代理没有显示脱机/ SQL Server在SQL Server中处于ONLINE状态的原因 代理日志显示“正在等待SQL Server恢复 MSDB ......“。我们还每天检查SQL Server服务状态 通过“sys.dm_server_services”DMV但它从未向我们展示过 SQL Server代理未启动并正在运行。