我有一个在DigitalOcean上托管的简单NodeJS应用程序。 由于某些我无法找到的原因,该应用程序几乎每天都会停止。 它发生的时间也非常准确,大约在上午08:30。
我已检查过DigitalOcean主机未重启。 它的正常运行时间是几周。我添加了一些未捕获的异常处理程序,希望有一些东西会崩溃应用程序但没有记录任何内容:
process.on('uncaughtException', function (err) {
console.error((new Date).toUTCString() + ' uncaughtException:', err.message);
console.error(err.stack);
process.exit(1);
});
服务器一直由UptimeRobot监控,直到"崩溃"我可以在日志中看到它工作正常,最后记录的请求是UptimeRobot发送的请求。
我有另一台服务器用于不同的环境,配置几乎相同,更糟糕的是,它每天下降大约三次。
以上看起来与服务器工作负载完全无关。每天重启三次的功能用于某些功能检查,因此几乎未使用。
现在我被卡住了。我不知道如何处理这个问题。
您可以在下面找到我用来启动服务器的脚本:
#!/bin/sh
set -e
### BEGIN INIT INFO
# Provides: myapp-server
# Required-Start: $remote_fs $syslog $network
# Required-Stop: $remote_fs $syslog $network
# Default-Start: 2 3 4 5
# Default-Stop: 0 1 6
# Short-Description: MyApp backend server
### END INIT INFO
[ -f /etc/default/myapp-server ] && . /etc/default/myapp-server
user="myapp"
dir="/home/$user/web-server/repository/backend"
cmd="node app.js"
name="myapp-server"
pid_file="/var/run/$name.pid"
stdout_log="/var/log/$name.log"
stderr_log="/var/log/$name.err"
get_pid() {
cat "$pid_file"
}
is_running() {
[ -f "$pid_file" ] && ps `get_pid` > /dev/null 2>&1
}
case "$1" in
start)
if is_running; then
echo "Already started"
else
echo "Starting $name"
cd "$dir"
#sudo -E -u "$user" $cmd >> "$stdout_log" 2>> "$stderr_log" &
$cmd >> "$stdout_log" 2>> "$stderr_log" &
echo $! > "$pid_file"
if ! is_running; then
echo "Unable to start, see $stdout_log and $stderr_log"
exit 1
fi
fi
;;
stop)
if is_running; then
echo -n "Stopping $name.."
kill `get_pid`
for i in {1..10}
do
if ! is_running; then
break
fi
echo -n "."
sleep 1
done
echo
if is_running; then
echo "Not stopped; may still be shutting down or shutdown may have failed"
exit 1
else
echo "Stopped"
if [ -f "$pid_file" ]; then
rm "$pid_file"
fi
fi
else
echo "Not running"
fi
;;
restart)
$0 stop
if is_running; then
echo "Unable to stop, will not attempt to start"
exit 1
fi
$0 start
;;
status)
if is_running; then
echo "Running"
else
echo "Stopped"
exit 1
fi
;;
*)
echo "Usage: $0 {start|stop|restart|status}"
exit 1
;;
esac
exit 0
这是我的包裹清单:
{
"name": "MyApp",
"version": "0.0.1",
"description": "Sample description",
"author": "Me",
"private": true,
"scripts": {
"start": "node app.js"
},
"engines": {
"node": "0.10.33",
"npm": "1.4.28"
},
"dependencies": {
"bluebird": "^2.9.8",
"bookshelf": "^0.7.9",
"cors": "^2.7.1",
"express": "3.4.8",
"jade": "*",
"knex": "^0.7.3",
"libphonenumber": "0.0.9",
"node-uuid": "^1.4.3",
"node.extend": "^1.1.3",
"nodemailer": "^1.3.4",
"pg": "^4.2.0",
"request": "^2.53.0",
"ssl-root-cas": "^1.1.7",
"xmlbuilder": "^2.6.1",
"xoauth2": "^1.0.0"
}
}
更新:使用PM2部署
我已经使用PM2部署了应用程序,并且没有从日志中获得更多内容。 服务器崩溃前的示例:
HEAD / 302 5ms - 112b
HEAD / 302 3ms - 112b
HEAD / 302 5ms - 112b
HEAD / 302 2ms - 112b
HEAD / 302 12ms - 112b
HEAD / 302 3ms - 112b
GET /tmUnblock.cgi 400 1286ms - 1.14kb
GET / 302 9ms - 62b
HEAD / 302 6ms - 112b
HEAD / 302 11ms - 112b
Environment: development
Express server listening on port 3001
HEAD / 302 20ms - 112b
HEAD / 302 10ms - 112b
HEAD / 302 10ms - 112b
HEAD / 302 2ms - 112b
HEAD / 302 3ms - 112b
HEAD / 302 2ms - 112b
HEAD / 302 7ms - 112b
HEAD / 302 2ms - 112b
没有什么可疑的,只是因为缺少 tmUnblock.cgi 安全漏洞而尝试。
答案 0 :(得分:1)
你的运行内存是什么类型的VPS?此外,服务器上还运行其他进程。我遇到了Node(无关)的问题,它将随机停止工作而不进行日志记录。问题结果是内存使用情况。我建议用
检查你的内存使用情况free -m
此外,如果是这种情况,我还要确保您已启用交换以缓解内存问题。本教程将指导您创建交换创建https://www.digitalocean.com/community/tutorials/how-to-add-swap-on-ubuntu-14-04,假设您使用的是Ubuntu。 Google搜索如何使用DO创建交换提供了大量结果
希望这有帮助