mysqld服务每天在ec2服务器上停止一次

时间:2012-08-24 18:23:56

标签: linux amazon-ec2 mysql

环境详情:

Server: Amazon ec2 Linux
Web Server: Apache
Web Framework: Django with mod_wsgi

以下我在mysql_err.log文件中找到了。

The InnoDB memory heap is disabled
120823  3:21:40 InnoDB: Mutexes and rw_locks use GCC atomic builtins
120823  3:21:40 InnoDB: Compressed tables use zlib 1.2.3
120823  3:21:40 InnoDB: Using Linux native AIO
120823  3:21:41 InnoDB: Initializing buffer pool, size = 128.0M
InnoDB: mmap(137363456 bytes) failed; errno 12
120823  3:21:41 InnoDB: Completed initialization of buffer pool
120823  3:21:41 InnoDB: Fatal error: cannot allocate memory for the buffer pool
120823  3:21:41 [ERROR] Plugin 'InnoDB' init function returned error.
120823  3:21:41 [ERROR] Plugin 'InnoDB' registration as a STORAGE ENGINE failed.
120823  3:21:41 [ERROR] Unknown/unsupported storage engine: InnoDB
120823  3:21:41 [ERROR] Aborting

看起来系统内存不足以将内存分配给缓冲池。当我使用Amazon ec2 micro instance时发生同样的错误,所以我转移到了small instance。它可以工作好几天,但现在它再次打破一天。对此有永久性的解决方案吗?我可以转移到中型实例,但问题是否会被修复?我应该减少innodb_buffer_pool_size,首选尺寸是多少?

cat /proc/meminfo的结果如下(可能会有所帮助):

MemTotal:        1697824 kB
MemFree:          125744 kB
Buffers:          109704 kB
Cached:           481408 kB
SwapCached:            0 kB
Active:          1212396 kB
Inactive:         266840 kB
Active(anon):     888192 kB
Inactive(anon):       76 kB
Active(file):     324204 kB
Inactive(file):   266764 kB
Unevictable:           0 kB
Mlocked:               0 kB
SwapTotal:             0 kB
SwapFree:              0 kB
Dirty:                 4 kB
Writeback:             0 kB
AnonPages:        888144 kB
Mapped:            15604 kB
Shmem:               144 kB
Slab:              63752 kB
SReclaimable:      53680 kB
SUnreclaim:        10072 kB
KernelStack:         800 kB
PageTables:        16436 kB
NFS_Unstable:          0 kB
Bounce:                0 kB
WritebackTmp:          0 kB
CommitLimit:      848912 kB
Committed_AS:    1417140 kB
VmallocTotal:   34359738367 kB
VmallocUsed:       10988 kB
VmallocChunk:   34359725168 kB
DirectMap4k:     1748992 kB
DirectMap2M:           0 kB

操作系统版本(uname -a): Linux ip-10-246-134-149 3.2.21-1.32.6.amzn1.x86_64 #1 SMP Sat Jun 23 02:32:15 UTC 2012 x86_64 x86_64 x86_64 GNU/Linux

我检查了ps aux命令,服务器只剩下15MB的内存,这些是当时正在运行的httpd进程:

free -m

的结果
total       used       free     shared    buffers     cached
Mem:          1657       1628         29          0          3         19
-/+ buffers/cache:       1605         51
Swap:          895        875         20

ps aux

的结果
apache   21123  0.1  1.2 394652 20464 ?        S    19:35   0:06 /usr/sbin/httpd
apache   21146  0.1  1.2 394280 20796 ?        S    19:38   0:06 /usr/sbin/httpd
apache   21152  0.1  1.2 394284 21560 ?        S    19:38   0:05 /usr/sbin/httpd
apache   21155  0.2  1.4 396244 24528 ?        S    19:38   0:06 /usr/sbin/httpd
apache   21156  0.1  1.1 392552 20344 ?        S    19:38   0:06 /usr/sbin/httpd
apache   21157  0.1  1.1 394284 18884 ?        S    19:38   0:05 /usr/sbin/httpd
apache   21159  0.1  1.4 396200 25040 ?        S    19:38   0:06 /usr/sbin/httpd
apache   21161  0.1  1.2 394856 21724 ?        S    19:38   0:06 /usr/sbin/httpd
apache   21162  0.1  1.3 394864 22400 ?        S    19:38   0:06 /usr/sbin/httpd
apache   21163  0.1  1.3 394860 22204 ?        S    19:38   0:06 /usr/sbin/httpd
apache   21164  0.1  1.1 392560 19204 ?        S    19:38   0:06 /usr/sbin/httpd
apache   21165  0.1  1.3 394832 22280 ?        S    19:38   0:06 /usr/sbin/httpd
apache   21166  0.1  1.3 395276 22932 ?        S    19:38   0:06 /usr/sbin/httpd
apache   21172  0.2  1.4 396320 24820 ?        S    19:38   0:06 /usr/sbin/httpd
apache   21174  0.2  1.7 400672 29452 ?        S    19:39   0:06 /usr/sbin/httpd
apache   21178  0.1  1.4 400540 25304 ?        S    19:39   0:06 /usr/sbin/httpd
apache   21179  0.2  1.6 400580 27856 ?        S    19:39   0:06 /usr/sbin/httpd
apache   21184  0.1  1.7 400628 29320 ?        S    19:39   0:06 /usr/sbin/httpd
apache   21185  0.1  1.6 397944 27292 ?        S    19:39   0:05 /usr/sbin/httpd
apache   21186  0.1  1.5 397960 25648 ?        S    19:39   0:05 /usr/sbin/httpd
apache   21187  0.1  1.7 400576 29120 ?        S    19:39   0:06 /usr/sbin/httpd
apache   21191  0.1  1.4 400576 24400 ?        S    19:39   0:06 /usr/sbin/httpd
apache   21193  0.1  1.4 400536 24940 ?        S    19:39   0:05 /usr/sbin/httpd
apache   21194  0.1  1.5 400572 26096 ?        S    19:39   0:06 /usr/sbin/httpd
apache   21203  0.1  1.6 400580 28808 ?        S    19:39   0:05 /usr/sbin/httpd
apache   21206  0.1  1.7 400584 29732 ?        S    19:39   0:06 /usr/sbin/httpd
apache   21207  0.1  1.6 400576 27940 ?        S    19:39   0:06 /usr/sbin/httpd
apache   21224  0.1  1.2 400624 20768 ?        S    19:39   0:06 /usr/sbin/httpd
apache   21225  0.1  1.6 400576 28468 ?        S    19:39   0:05 /usr/sbin/httpd
apache   21226  0.1  1.6 400576 28048 ?        S    19:39   0:06 /usr/sbin/httpd
apache   21228  0.1  1.4 400572 23880 ?        S    19:39   0:06 /usr/sbin/httpd
apache   21237  0.1  1.5 400628 26124 ?        S    19:39   0:06 /usr/sbin/httpd
apache   21265  0.1  1.6 400536 28592 ?        S    19:39   0:06 /usr/sbin/httpd
apache   21276  0.1  1.2 400544 21456 ?        S    19:39   0:05 /usr/sbin/httpd
apache   21277  0.1  1.3 400624 22676 ?        S    19:39   0:05 /usr/sbin/httpd
apache   21278  0.1  1.6 400536 27360 ?        S    19:39   0:06 /usr/sbin/httpd
apache   21282  0.1  1.4 400612 24996 ?        S    19:39   0:06 /usr/sbin/httpd
apache   21292  0.1  1.4 400532 24780 ?        S    19:39   0:05 /usr/sbin/httpd
apache   21302  0.2  1.2 400540 21332 ?        S    19:39   0:06 /usr/sbin/httpd
apache   21303  0.1  1.3 400628 22228 ?        S    19:39   0:06 /usr/sbin/httpd
apache   21305  0.2  1.2 400536 21116 ?        S    19:39   0:06 /usr/sbin/httpd
apache   21306  0.1  1.3 400572 22380 ?        S    19:39   0:06 /usr/sbin/httpd
apache   21307  0.1  1.1 397956 20056 ?        S    19:39   0:05 /usr/sbin/httpd
apache   21308  0.1  1.2 400624 21520 ?        S    19:39   0:06 /usr/sbin/httpd
apache   21319  0.1  1.1 400540 19468 ?        S    19:39   0:05 /usr/sbin/httpd
apache   21320  0.1  1.3 400628 22712 ?        S    19:39   0:05 /usr/sbin/httpd
apache   21335  0.1  1.0 400540 17236 ?        S    19:39   0:05 /usr/sbin/httpd
apache   21336  0.1  1.3 400628 22188 ?        S    19:39   0:06 /usr/sbin/httpd
apache   21352  0.1  1.1 394276 18972 ?        S    19:40   0:04 /usr/sbin/httpd
apache   21356  0.1  1.1 394280 19028 ?        S    19:40   0:05 /usr/sbin/httpd
apache   21358  0.1  1.1 394280 19004 ?        S    19:40   0:05 /usr/sbin/httpd
apache   21361  0.2  0.7 400452 12632 ?        S    19:40   0:06 /usr/sbin/httpd
apache   21610  0.2  1.6 400536 27660 ?        S    19:46   0:06 /usr/sbin/httpd
apache   21643  0.2  1.3 400156 23272 ?        S    19:55   0:04 /usr/sbin/httpd
apache   21647  0.2  1.0 400544 17556 ?        S    19:57   0:05 /usr/sbin/httpd
apache   21654  0.2  1.5 400188 26884 ?        S    19:58   0:05 /usr/sbin/httpd
apache   21719  0.3  1.9 400192 32264 ?        S    20:14   0:03 /usr/sbin/httpd
apache   21725  0.2  2.0 400044 35340 ?        S    20:15   0:03 /usr/sbin/httpd
apache   21738  0.0  0.8 257648 13792 ?        S    20:26   0:00 /usr/sbin/httpd

任何人都可以知道为什么会有这么多的httpd进程吗?

6 个答案:

答案 0 :(得分:38)

使用50%的可用内存来测试:

您可以将innodb_buffer_pool_size降低到非常低的水平以查看它是否有帮助:

#/etc/my.cnf 
innodb_buffer_pool_size = 1M

根据经验,将innodb_buffer_pool_size设置为可用内存的50%,用于低内存测试。这意味着您启动服务器和除了 MySQL InnoDB之外的所有内容。看看你有多少RAM。然后将50%用于InnoDB。

一次尝试多种低内存设置:

更可能的罪魁祸首是该服务器上的其他内容,例如网络服务器。

阿帕奇?

您使用的是Apache和/或其他网络服务器吗?如果是这样,请尝试减少其RAM使用率。例如,在Apache conf中,考虑低RAM设置,如下所示:

StartServers 1
MinSpareServers 1
MaxSpareServers 5
MaxClients 5

并限制这样的请求:

MaxRequestsPerChild 300

然后重启Apache。

mod_wsgi的:

如果您正在使用带有mod_python的Apache,请使用mod_wsgi切换到Apache。

Pympler:

如果它仍在发生,可能你的Django正在稳步增长。使用Pympler尝试Django内存分析:

SAR:

您每天一次失败的报告,然后是每周一次的失败,可能指向每天或每周运行的某种cron作业。例如,可能存在占用大量RAM或数据库转储等的批处理过程。

要跟踪RAM使用并在MySQL死亡前一小时查找RAM峰值,请查看SAR,这是一个很棒的工具:http://www.thegeekstuff.com/2011/03/sar-examples/

答案 1 :(得分:9)

你必须减少你innodb_buffer_pool_size =< 60-80%的主存储器)

Innodb错误的解决方案:

110603  7:34:15 [ERROR] Plugin ‘InnoDB’ init function returned error.
110603  7:34:15 [ERROR] Plugin ‘InnoDB’ registration as a STORAGE ENGINE failed.
110603  7:34:15 [ERROR] Unknown/unsupported storage engine: InnoDB
110603  7:34:15 [ERROR] Aborting

10603  7:34:15 [Note] /usr/sbin/mysqld: Shutdown complete

I moved the ib_logfile0 and ib_logfile01 to bak and start Mysql again. Now this time, it is working fine

[root@xxx mysql]# mv ib_logfile0 ib_logfile0-bak
[root@xxx mysql]# mv ib_logfile1 ib_logfile1-bak

来源:http://www.onaxer.com/tag/error-plugin-innodb-init-function-returned-error/

答案 2 :(得分:2)

就像其他人提到的那样,问题似乎是你的系统在RAM上运行不足而MySQL因此而爆炸。下面是如何缩小系统内存的使用范围以及如何从数据库中恢复。

查看collectd及其插件。一些适用的可能是processes pluginmemory plugin。通过这些,您可以看到系统的内存使用情况以及占用大部分内存的进程。

根据您运行Django的方式,您可以将工作进程配置为仅处理一定数量的请求然后终止。这样,如果您的应用程序中存在某种内存泄漏,它将不会持续超过该数量的请求。例如,如果您使用Gunicorn,则可以使用--max-requests选项。将其设置为500将在处理完500个请求后丢弃该工作人员。

以上结合stats集合将向您展示一些有趣的内存使用趋势。

对于数据库关闭,你可以设置进程监督,这样如果MySQL死了,它将自动重启。最新版本的Ubuntu中的MySQL使用Upstart来做到这一点。如果该过程终止,Upstart会立即将其恢复。如果您使用的是另一个没有此内置版本的发行版,请查看Supervisor。虽然这不能解决问题,但它至少会减轻其影响。这不应被视为修复,而是一种在出现问题时保持应用程序运行的方法。

答案 3 :(得分:1)

一旦我陷入类似的问题,我真的很沮丧,我的用户看到这个丑陋的消息建立数据库连接错误。而不是解决确切的问题,我发现this repo对我来说就像一个魅力(暂时)。之后我被我的朋友调试了,他只是通过一些配置更改来调整我的服务器。但是我仍然每隔10分钟将这个脚本添加到我的crontab中,然后检查服务器是否崩溃(我的情况下最终在我的服务器上运行VNCServer时崩溃)然后重新启动它

答案 4 :(得分:0)

通过添加新的交换空间来增加可用RAM也可能有所帮助。步骤为here

确保创建小于

所示可用空间大小的/ swapfile
df -h

例如,对我来说,df-h的输出是:

Filesystem      Size  Used Avail Use% Mounted on
/dev/xvda1      7.8G  1.2G  6.3G  16% /
none            4.0K     0  4.0K   0% /sys/fs/cgroup
udev            492M   12K  492M   1% /dev
tmpfs           100M  336K   99M   1% /run

所以我创建了2 G

sudo fallocate -l 2G /swapfile

然后启动服务

sudo /etc/init.d/mysql restart

希望这会有所帮助。一切顺利。

答案 5 :(得分:0)

我发现此讨论增加了答案,并为我工作:https://www.digitalocean.com/community/questions/mysql-server-keeps-stopping-unexpectedly?answer=26016

您必须同时进行innodb_buffer_pool_sizemy.conf/etc/mysql/my.cnf上的 32M 之类的合理操作,并且您可能还需要修改/etc/apache2/mods-enabled/mpm_prefork.conf减少apache启动的连接数;

<IfModule mpm_prefork_module>
    StartServers     3
    MinSpareServers  3
    MaxSpareServers  5
    MaxRequestWorkers 25
    MaxConnectionsPerChild  0
</IfModule>