我们在azure上有一个经典的VM。所有它正在运行的是带有大量数据库的SQL服务器(我们有另一个虚拟机是一个Web服务器,它是面向Web的一方,它访问sql经典虚拟机的数据)。
我们遇到的问题是,自昨天上午以来,我们现在每2-3小时就会遇到停电。似乎没有任何理由。我们一直在使用Azure支持,但他们似乎仍在努力解决问题所在。事件日志中似乎没有任何内容可以为我们提供任何信息。
所有发生的事情是我们收到一个pingdom警告说盒子已经出来,然后我们无法远程进入它,因为它超时并且所有数据库调用都失败了。 5分钟后它会回来。它似乎没有完全重启或任何它只是讨厌。
关于这可能是由什么造成的任何想法?或者我们可以寻找更好信息的任何地方?或者是如何解决这个问题呢?
似乎在同一时间发生的事件日志中唯一的事情是DNS客户端事件“在没有配置的DNS服务器响应后,名称[DNSName]的名称解析超时。”
答案 0 :(得分:1)
最智能或快速恢复:
您是否通过使用localhost或127.0.0.1/Instance名称连接内部VM(内部)来检查SQL Server。如果您能够在内部连接没有任何问题的SQL Server,然后Capture或快照SQL Server VM和使用Capture VM创建新VM(即不丢失任何数据)。
可能会出现以下问题:
答案 1 :(得分:0)
这最终导致我们的VM所在的节点/扇区出错。我通过扩大VM实例的大小(4核到8核)来解决这个问题,这迫使azure将其移动到另一个节点/扇区,这解决了这个问题。