Nginx / Apache / WSGI / Django - 意外引发500错误(Nginx上499)

时间:2016-04-19 19:27:12

标签: django apache nginx mod-wsgi

我的Webfaction托管上的Django服务器出现问题。对于某些请求(每天500.000左右的大约1.000个请求),我可以看到访问日志中的错误。在nginx日志中,我可以看到带有代码" 499"的请求,在apache日志中他们有" 500"错误代码。

奇怪的是我在我的django日志中没有看到任何问题(通常我收到的邮件除了堆栈跟踪)。你能帮帮我吗,这会引起什么奇怪的行为?

我在收到超出托管内存限制的问题后开始调查日志。似乎我的应用程序有一些内存泄漏,因为我可以看到使用的内存缓慢上升。所以我尝试通过优化我的wsgi进程,线程并尝试设置最大请求参数来快速修复。在此之后,我将调查内存泄漏的原因。

我的基础设施如下:

  • Nginx - 前端服务器(由Webfaction运营)
  • Apache / 2.4.16,mod_wsgi 4.4.13 / Python 3.4
  • Django 1.8.12

我的httpd.conf如下:

ServerRoot "/home/quick/webapps/citaty/apache2"

LoadModule authz_core_module modules/mod_authz_core.so
LoadModule dir_module        modules/mod_dir.so
LoadModule env_module        modules/mod_env.so
LoadModule log_config_module modules/mod_log_config.so
LoadModule mime_module       modules/mod_mime.so
LoadModule rewrite_module    modules/mod_rewrite.so
LoadModule setenvif_module   modules/mod_setenvif.so
LoadModule wsgi_module       modules/mod_wsgi.so
LoadModule unixd_module      modules/mod_unixd.so

LogFormat "%{X-Forwarded-For}i %l %u %t %{Host}i \"%r\" %>s %b \"%{Referer}i\" \"%{User-Agent}i\" %T %D" combined
CustomLog /home/quick/logs/user/access_citaty.log combined
ErrorLog /home/quick/logs/user/error_citaty.log

Listen 21628
KeepAlive Off
SetEnvIf X-Forwarded-SSL on HTTPS=1
ServerLimit 1
StartServers 1
MaxRequestWorkers 10
MinSpareThreads 1
MaxSpareThreads 5
ThreadsPerChild 10
MaxRequestsPerChild 1000

WSGIRestrictEmbedded On
WSGILazyInitialization On

<VirtualHost *>
    ServerName domain.com

    CustomLog /home/quick/logs/user/access_citaty.log combined
    ErrorLog /home/quick/logs/user/error_citaty.log

    WSGIDaemonProcess citaty processes=5 threads=1 maximum-requests=1000 python-path=/home/quick/webapps/citaty:/home/quick/webapps/citaty/lib/python3.4/site-packages display-name=%{GROUP}
    WSGIProcessGroup citaty
    WSGIScriptAlias / /home/quick/webapps/citaty/apache2/conf/citaty.wsgi

</VirtualHost>

<VirtualHost *>
    ServerName domain2.com

    CustomLog /home/quick/logs/user/access_citaty_laska.log combined
    ErrorLog /home/quick/logs/user/error_citaty_laska.log

    WSGIDaemonProcess citaty_laska processes=1 threads=1 maximum-requests=1000 python-path=/home/quick/webapps/citaty:/home/quick/webapps/citaty/lib/python3.4/site-packages display-name=%{GROUP}
    WSGIProcessGroup citaty_laska
    WSGIScriptAlias / /home/quick/webapps/citaty/apache2/conf/citaty_laska.wsgi
</VirtualHost>

我的django日志记录设置如下:

LOGGING = {
    'version': 1,
    'disable_existing_loggers': False,
    'filters': {
        'require_debug_false': {
            '()': 'django.utils.log.RequireDebugFalse',
        },
        'require_debug_true': {
            '()': 'django.utils.log.RequireDebugTrue',
        },
    },
    'handlers': {
        'file': {
            'level': 'INFO',
            'filters': ['require_debug_false'],
            'class': 'logging.FileHandler',
            'filename': '/home/quick/logs/user/django_citaty.log',
        },
        'file_jobs': {
            'class': 'logging.FileHandler',
            'filename': '/home/quick/logs/user/django_jobs.log',
        },
        'mail_admins': {
            'level': 'ERROR',
            'filters': ['require_debug_false'],
            'class': 'django.utils.log.AdminEmailHandler'
        },
        'console': {
            'class': 'logging.StreamHandler',
        },
    },
    'loggers': {
        'django': {
            'handlers': ['file', 'mail_admins'],
        },
        'py.warnings': {
            'handlers': ['file'],
        },
        'citaty.sources.crawlers.base': {
            'level': 'INFO',
            'handlers': ['file_jobs', 'console'],
        },

    },
}

1 个答案:

答案 0 :(得分:1)

我曾经在一个月前面对这个问题。突然之间,nginx会开始抛出499个错误代码。

当客户端发出请求时,nginx要求uwsgi进行响应,有时uwsgi响应时间过长,用户认为请求缓慢并尝试刷新或进行另一次调用,然后nginx会抛出499错误代码。

可能的原因: -

  1. Uwsgi工作人员消耗相当多的RAM。检查uwsgi配置文件中有多少工作人员。确保根据您的系统设置将uwsgi工作进程限制为适当的数字。
  2. 增加nginx工作者连接。默认值非常低。这会导致连接丢失,从而导致500个错误。检查nginx中的connection_timeout设置。一般是60秒。您可以将其减少到25秒左右,以确保nginx已准备好接受更多连接。
  3. 我通过增加服务器RAM来修复此问题,并添加了负载均衡器以确保一台服务器上没有重负载。 另外,对uwsgi ini文件和nginx.conf进行了一些更改

    以下是我的uwsgi设置文件 -

    [uwsgi]
    project =xxxxxx
    base = /home/ubuntu
    
    chdir = %(base)/xxxxxxx/server
    home = %(base)/envs/api
    module = %(project).wsgi:application
    
    master = true
    cheaper-algo = spare
    cheaper = 2
    cheaper-initial = 3
    cheaper-step = 2
    processes = 20
    workers = 20
    max-requests = 1000
    
    socket = %(base)/xxxx/server/%(project).sock
    chmod-socket = 664
    vacuum = true
    logto=/tmp/uwsgi.log
    

    我的nginx.conf -

    user www-data;
    worker_processes 4;
    pid /run/nginx.pid;
    
    events {
        worker_connections 2048;
        # multi_accept on;
    }
    

    底线 - 这几乎总是一个内存问题。重新检查代码是否存在内存泄漏。确保生产中的settings.py中的DEBUG = False。使用缓存来减少服务器响应时间。