板上的大大們好
小弟我最近要做系統服務的死活監控
監控的項目包含
httpd snmp named nginx redis-server node mysqld mongod PM2 memcached
服務都有加上enable自動啟動
為了保險
寫了一隻script 確認運作期間的狀態
systemctl status $line | grep running && echo "$line OK" || echo "$line error
!"
但是考慮到服務hang住
或是重啟一直失敗之類的狀況
想請教除了我這種使用systemctl及service status的方式
或是telnet確認port狀態 , wget針對網頁服務測試
還有沒有別的方式呢?
nagios ? 你大概需要這種監視服務只是老實說稍微複雜,不是非常易用的軟體
作者:
lantw44 (#######################)
2017-11-15 13:23:00systemd service 檔案有個 Restart= 選項可以自動服務可以先用 man systemd.service 看看這功能是否適合使用再用 systemctl edit 把 Restart= 參數加上去是正常的,因為 systemctl edit 的作法是在/etc/systemd/system 底下建一個資料夾在裡面寫 .conf 檔這樣就不會直接動到 service 檔,更新時才不會被覆寫掉改完可以用 systemctl cat 看到一個服務有多少這種檔案
作者:
kojj (我先想想)
2017-11-15 15:05:00Ubuntu 有一個monit 的套件,預設就可以監控httpd等常用服務範例說明 goo.gl/WEkmyMcentos 也有這套件 goo.gl/qd8js8
svscannagios 裝起來一堆寫好的 plugin 隨插即用 哪裡困難阿
作者:
soem (æµæ°´)
2017-11-16 01:25:00munin + monit
supervisord...怎麼沒人提呢?跟systems 是同類的東西,如果只是要重啟夠用了,有web gui跟導log的功能,不過你這麼多服務,學個經典的nagios啊,介面是有點陽春,但是你提到的那些全部都有現成的plugin,上手後隨插即用
mongod異常退出的話,是無法直接重啟的,因為會被lock file卡住,要先下完 --repair 才有辦法重新打開
作者:
suaw (suaw)
2017-11-28 04:37:00keepalived 運用在NGINX httpd應該是沒問題,其他服務沒試過,給您參考