应用错误收集

时间：2016-04-28 21:04:52

标签： azure crash azure-virtual-machine

我们在azure上有一个经典的VM。所有它正在运行的是带有大量数据库的SQL服务器（我们有另一个虚拟机是一个Web服务器，它是面向Web的一方，它访问sql经典虚拟机的数据）。

我们遇到的问题是，自昨天上午以来，我们现在每2-3小时就会遇到停电。似乎没有任何理由。我们一直在使用Azure支持，但他们似乎仍在努力解决问题所在。事件日志中似乎没有任何内容可以为我们提供任何信息。

所有发生的事情是我们收到一个pingdom警告说盒子已经出来，然后我们无法远程进入它，因为它超时并且所有数据库调用都失败了。 5分钟后它会回来。它似乎没有完全重启或任何它只是讨厌。

关于这可能是由什么造成的任何想法？或者我们可以寻找更好信息的任何地方？或者是如何解决这个问题呢？

似乎在同一时间发生的事件日志中唯一的事情是DNS客户端事件“在没有配置的DNS服务器响应后，名称[DNSName]的名称解析超时。”

答案 0 :(得分：1)

最智能或快速恢复：

您是否通过使用localhost或127.0.0.1/Instance名称连接内部VM（内部）来检查SQL Server。如果您能够在内部连接没有任何问题的SQL Server，然后Capture或快照SQL Server VM和使用Capture VM创建新VM（即不丢失任何数据）。

可能会出现以下问题：

答案 1 :(得分：0)

这最终导致我们的VM所在的节点/扇区出错。我通过扩大VM实例的大小（4核到8核）来解决这个问题，这迫使azure将其移动到另一个节点/扇区，这解决了这个问题。