AWS EC2 t2.micro实例非常不稳定

时间:2015-06-26 22:34:04

标签: amazon-web-services amazon-ec2 reboot

我正在AWS EC2 t2.micro实例上运行wordpress页面。没有什么花哨但只是一个简单的wordpress网站。

每隔几周发生一次非常一致:

  1. 我的页面无法访问,ssh无法访问
  2. 检查仪表板时,一切正常,没有警告或投诉
  3. 在AWS管理面板上重新启动它,其中一项检查将失败:“实例可达性检查在(时间)失败”
  4. 系统日志显示存在内核崩溃(下面复制了所有日志)。什么可能导致这个? AWS端的硬件坏了吗?这真让我很困惑,请帮忙。谢谢!

    [2950123.794183] end_request: I/O error, dev xvda, sector 13514688
    [2950123.797618] end_request: I/O error, dev xvda, sector 13514712
    [2950123.798170] end_request: I/O error, dev xvda, sector 13514776
    [2950123.798170] end_request: I/O error, dev xvda, sector 13514816
    [2950123.798170] end_request: I/O error, dev xvda, sector 13514872
    [2950123.798170] end_request: I/O error, dev xvda, sector 12894512
    [2950123.798170] end_request: I/O error, dev xvda, sector 12875536
    [2950123.798170] end_request: I/O error, dev xvda, sector 511456
    [2950123.798170] end_request: I/O error, dev xvda, sector 13403944
    [2950123.798170] end_request: I/O error, dev xvda, sector 515968
    [2950124.114201] Kernel panic - not syncing: Attempted to kill init! exitcode=0x00000007
    [2950124.114201] 
    [2950124.118093] CPU: 0 PID: 1 Comm: init Not tainted 3.14.35-28.38.amzn1.x86_64 #1
    [2950124.118093] Hardware name: Xen HVM domU, BIOS 4.2.amazon 05/06/2015
    [2950124.118093]  ffff88003d578ae0 ffff88003da2bc80 ffffffff814867ca ffffffff81788cf0
    [2950124.118093]  ffff88003da2bcf8 ffffffff814825ab ffffffff00000010 ffff88003da2bd08
    [2950124.118093]  ffff88003da2bca8 ffffffff81c9af20 0000000000000007 ffff88003da30480
    [2950124.118093] Call Trace:
    [2950124.118093]  [<ffffffff814867ca>] dump_stack+0x45/0x56
    [2950124.118093]  [<ffffffff814825ab>] panic+0xc8/0x1cd
    [2950124.118093]  [<ffffffff8105ffd1>] do_exit+0xa41/0xa50
    [2950124.118093]  [<ffffffff8106005f>] do_group_exit+0x3f/0xa0
    [2950124.118093]  [<ffffffff8106f707>] get_signal_to_deliver+0x1c7/0x6e0
    [2950124.118093]  [<ffffffff81014458>] do_signal+0x48/0x6f0
    [2950124.118093]  [<ffffffff811e7c38>] ? fsnotify+0x228/0x2f0
    [2950124.118093]  [<ffffffff81014b68>] do_notify_resume+0x68/0x90
    [2950124.118093]  [<ffffffff8148d822>] retint_signal+0x48/0x86
    

1 个答案:

答案 0 :(得分:3)

您应该将解决方案设计为失败。失败是不可避免的,但是aws提供了解决问题的所有服务。

在autscaling组中设置ec2实例,并创建/设置AWS可用于确定您的实例是否正常运行的运行状况检查。

如果您正确设置,当AWS发现您的实例失败/失败时,它会自动将您的实例替换为另一个实例。

这需要您正确地设计工作,但是当您出现问题时,您不再需要担心观看/检查实例并启动新实例。

http://docs.aws.amazon.com/AutoScaling/latest/DeveloperGuide/WhatIsAutoScaling.html

请不要将您的EC2实例视为正常的托管服务提供商软件包,即您购买并提供解决方案,并期望它永远运行。如果这是您的计划,那么您最好与常规托管服务提供商合作 - 他们将通过为您管理底层硬件/软件来确保您的网站永远运行。

如果您打算加入AWS,请充分利用他们的平台。

至于你的具体问题,我倾向于考虑内存泄漏 - 症状听起来正确,你开始新鲜它一次运行几天/几周,然后崩溃。