场景
我有一个systemd文件,我想有条件地运行它,但前提是将环境变量ISCAPTUREPOD设置为true。
我有一个在启动时运行两个服务的容器,但是在特殊情况下,我只希望其中一个服务运行。我正在通过Kubernetes传递环境变量,我想使用它来控制第二个服务是否启动。我有一个名为iscapturepod.sh的脚本,该脚本检查环境变量,它是ExecStartPre语句的一部分。我希望脚本在环境变量ISCAPTUREPOD设置为“ True”时成功,并且在不存在或设置为“ True”以外的其他条件时失败。
问题:
无论我做什么,ExecStartPre都会失败。我什至尝试使脚本说exit 0
。那是整个脚本中唯一的事情,只是因为我想强制成功。 Systemd仍然失败,状态为209 / STDOUT。
行情捕获服务:
[Unit]
Description=Moloch Capture
After=network.target
[Service]
Type=simple
Restart=on-failure
StandardOutput=tty
ExecStartPre= /bin/sh -c '/data/moloch/bin/iscapturepod.sh'
ExecStart=/bin/sh -c '/data/moloch/bin/moloch-capture -c MOLOCH_INSTALL_DIR/etc/config.ini ${OPTIONS} >> /data/moloch/logs/capture.log 2>&1'
LimitCORE=infinity
LimitMEMLOCK=infinity
[Install]
WantedBy=multi-user.target
脚本
#!/bin/bash
# This script checks to see whether this pod is or is not a capture pod
# Kubernetes will pass the ISCAPTUREPOD variable as an environment variable with
# value True to those pods meant for capture and False for the viewer pod.
# This allows us to only use one container for both the viewer and capture pods
# The molochcapture service will run this in an ExecStartPre statement. If it
# throws an error this will prevent the molochcapture service from starting
if [[ ! -z "${ISCAPTUREPOD}" ]]; then
if [[ "${ISCAPTUREPOD}" == "True" ]]; then
echo This is a capture pod
exit 0
else
echo This is not a capture pod 1>&2
exit 1
fi
else
echo This is not a capture pod 1>$2
exit 1
fi
根据this site 0应该成功。但是,即使将脚本更改为exit 0
,我仍然会得到:
[root@sensor1 /]# systemctl status molochcapture
● molochcapture.service - Moloch Capture
Loaded: loaded (/usr/lib/systemd/system/molochcapture.service; enabled; vendor preset: disabled)
Active: failed (Result: start-limit) since Mon 2019-01-21 12:58:20 UTC; 1s ago
Process: 281 ExecStartPre=/bin/sh -c /data/moloch/bin/iscapturepod.sh (code=exited, status=209/STDOUT)
Jan 21 12:58:20 sensor1.lan systemd[1]: Failed to start Moloch Capture.
Jan 21 12:58:20 sensor1.lan systemd[1]: Unit molochcapture.service entered failed state.
Jan 21 12:58:20 sensor1.lan systemd[1]: molochcapture.service failed.
Jan 21 12:58:20 sensor1.lan systemd[1]: molochcapture.service holdoff time over, scheduling restart.
Jan 21 12:58:20 sensor1.lan systemd[1]: Stopped Moloch Capture.
Jan 21 12:58:20 sensor1.lan systemd[1]: start request repeated too quickly for molochcapture.service
Jan 21 12:58:20 sensor1.lan systemd[1]: Failed to start Moloch Capture.
Jan 21 12:58:20 sensor1.lan systemd[1]: Unit molochcapture.service entered failed state.
Jan 21 12:58:20 sensor1.lan systemd[1]: molochcapture.service failed.
我已经手动检查了脚本能否正常工作,并且没有问题。 Kubernetes正按预期传递环境变量,脚本返回“ This is a capture pod”。我以为这可能与systemd无法访问STDOUT有关,但是那是我尝试exit 0
时仍然失败的原因。
答案 0 :(得分:1)
我从通用的Moloch模板获取了服务文件并对其进行了修改。我没有发现它的行为StandardOutput=tty
。当我意识到实现多种标准输出后,可以为服务文件选择。它们在此处有详细记录:https://www.freedesktop.org/software/systemd/man/systemd.exec.html。将值从tty更改为Inherit,可以解决我的问题。
问题是我试图输出到不存在的TTY行,这是引发错误的原因。
我的问题更加复杂,因为systemd不能从容器继承环境,因此脚本可以准确显示此失败。