nova-compute服务状态下降

时间:2016-11-04 07:36:41

标签: rabbitmq openstack openstack-nova

我的控制器和计算服务在同一个节点上运行,我有一个多功能的设置。所有我的新星和其他相关服务都已启动并运行。但是,当我尝试启动一个实例时,nova-compute进程的状态会变低。因此,实例停留在产卵状态。

> [root@localhost nova(keystone_admin)]# nova service-list
> +----+------------------+-----------------------+----------+---------+-------+----------------------------+-----------------+ | Id | Binary           | Host                  | Zone     | Status  |
> State | Updated_at                 | Disabled Reason |
> +----+------------------+-----------------------+----------+---------+-------+----------------------------+-----------------+ | 6  | nova-cert        | localhost.localdomain | internal | enabled |
> up    | 2016-11-04T07:24:32.000000 | -               | | 7  |
> nova-consoleauth | localhost.localdomain | internal | enabled | up   
> | 2016-11-04T07:24:32.000000 | -               | | 8  | nova-scheduler
> | localhost.localdomain | internal | enabled | up    |
> 2016-11-04T07:24:33.000000 | -               | | 9  | nova-conductor  
> | localhost.localdomain | internal | enabled | up    |
> 2016-11-04T07:24:33.000000 | -               | | 11 | nova-compute    
> | localhost.localdomain | nova     | enabled | **down**  |
> 2016-11-04T06:43:03.000000 | -               | | 12 | nova-console    
> | localhost.localdomain | internal | enabled | up    |
> 2016-11-04T07:24:32.000000 | -               |

====

  

[root @ localhost nova(keystone_admin)] #systemctl status   openstack-nova-compute.service -l●openstack-nova-compute.service -   OpenStack Nova Compute Server已加载:已加载   (/usr/lib/systemd/system/openstack-nova-compute.service; 启用;   供应商预设:已禁用)活动:自周五以来处于活动状态(正在运行)   2016-11-04 12:08:54 IST; 49分钟前主要PID:37586(nova-compute)
  CGroup:/system.slice/openstack-nova-compute.service              └─37586/ usr / bin / python2 / usr / bin / nova-compute

     

Nov 04 12:08:46 localhost.localdomain systemd [1]:启动OpenStack   Nova Compute Server ... Nov 04 12:08:53 localhost.localdomain   nova-compute [37586]:来自“DEFAULT”组的选项“verbose”是   不推荐删除。它的价值可能会被默默地忽略   未来。 11月04日12:08:53 localhost.localdomain nova-compute [37586]:   不推荐使用“DEFAULT”组中的选项“notification_driver”。使用   组“oslo_messaging_notifications”中的选项“driver”。 11月04日   12:08:54 localhost.localdomain systemd [1]:启动OpenStack Nova   计算服务器。

====== nova计算过程的状态非常好。 我的rabbitmq服务也正在运行

FYI,

  

[root @ localhost nova(keystone_admin)] #systemctl status   rabbitmq-server●rabbitmq-server.service - RabbitMQ broker加载:   已加载(/usr/lib/systemd/system/rabbitmq-server.service; 已启用;   供应商预设:已禁用)Drop-In:   /etc/systemd/system/rabbitmq-server.service.d              └─limits.conf

     

活跃:自2016年11月11日星期四12:32:08 IST; 24小时前   主PID:1835(beam.smp)CGroup:   /system.slice/rabbitmq-server.service              ├─1835/usr/lib64/erlang/erts-5.10.4/bin/beam.smp -W w -K true -A30 -P 1048576 - -root / usr / lib64 / erlang -progname erl - -home   / var / lib / rabbitmq --...              ├─1964/usr/lib64/erlang/erts-5.10.4/bin/epmd-daemon              ├─5873inet_gethost4              └─5875inet_gethost4

     

Nov 04 12:13:12 localhost.localdomain rabbitmq-server [1835]:   {user,<<“guest”>>,Nov 04 12:13:12 localhost.localdomain   rabbitmq-server [1835]:[管理员],11月04日12:13:12   localhost.localdomain rabbitmq-server [1835]:   rabbit_auth_backend_internal,...},11月04日12:13:12   localhost.localdomain rabbitmq-server [1835]:<<“/”>>,Nov 04 12:13:12   localhost.localdomain rabbitmq-server [1835]:[{<< ...>>,...},{...}],   11月04日12:13:12 localhost.localdomain rabbitmq-server [1835]:   < 0.14812.0&gt ;,< 0.14816.0>]}},Nov 04 12:13:12 localhost.localdomain   rabbitmq-server [1835]:{restart_type,intrinsic},Nov 04 12:13:12   localhost.localdomain rabbitmq-server [1835]:{shutdown,4294967295},   11月04日12:13:12 localhost.localdomain rabbitmq-server [1835]:   {child_type,worker}]}]}} Nov 04 12:13:12 localhost.localdomain   rabbitmq-server [1835]:function_clause

=======

  

[root @ localhost nova(keystone_admin)] #netstat -anp | grep 5672 | grep的    37586 tcp 0 0 10.1.10.22:55628 10.1.10.22:5672
  ESTABLISHED 37586 / python2 tcp 0 0 10.1.10.22:56204
  10.1.10.22:5672 ESTABLISHED 37586 / python2 tcp 0 0 10.1.10.22:56959 10.1.10.22:5672 ESTABLISHED 37586 / python2
  ===== 37586是nova-compute进程id。

我检查了nova-compute,nova-api和nova-conductor的日志,没有错误。

我检查了nova调度程序日志,并且有一些错误表明拒绝连接到rabbitmq和数据库服务。

**

  

2016-11-03 12:24:50.930 2092 ERROR nova.servicegroup.drivers.db   DBConnectionError:(pymysql.err.OperationalError)(2003,“不能   连接到'10 .1.10 .22'上的MySQL服务器([Errno 111] ECONNREFUSED)“)   2016-11-03 12:24:53.811 2092 ERROR oslo.messaging._drivers.impl_rabbit   [ - ] 10.1.10.22:5672上的AMQP服务器无法访问:[Errno 111]   ECONNREFUSED。

再试一次

**  16秒。

======= 有人可以建议我该怎么做来处理它。 由于我在同一节点上,为什么这些服务无法访问?

1 个答案:

答案 0 :(得分:1)

如果nova-compute停机,可能有两个原因: 一个。 nova-compute实际上已经下降了 湾它无法与兔子交流,或者新星导体无法与兔子交流。

据我所见,你的日志中存在问题:" 10.1.10.22:5672无法访问"。检查您是否有兔子监听此IP /端口。检查您是否可以从计算主机连接到兔子。我通常使用nc 10.1.10.22 5672来查看是否有连接。

检查兔子的nova设置是否正确。正确设置示例:

[DEFAULT]
rpc_backend=rabbit
rabbit_host=rabbitmq-ip-here
rabbit_port=5672
rabbit_hosts=$rabbit_host:$rabbit_port
rabbit_use_ssl=false
rabbit_userid=guest
rabbit_password=guest
rabbit_login_method=AMQPLAIN
rabbit_virtual_host=/compute

检查/ var / log / nova / * .log

中的日志

在nova.conf的[DEFAULT]部分启用debug = true