第一十二章 监控系统Nagios
第一节 Nagios概述
Nagios官方网站的描述:
Nagios is an open source host, service and network monitoring program.Who uses it? Lots of people, including many big companies and organizations.
首先,我们来看看实际工作中需要监控的对象有哪些?在这里我总结出两种类型的监控对象:网络服务监控及主机资源监控。网络服务监控可包括主机存活检查、Web服务监控、FTP服务监控、数据库服务监控、自定义服务监控等;主机资源监控可包括系统负载、当前IP连接数、磁盘空间使用情况、当前进程数以及自定义的资源监控等。
其次,我们再来看看Nagios监控的表现形式。监控的主要目的是当监控的对象发生故障或资源紧张时及时通知相关人员,以便问题得到迅速的处理。追求的效果就是“在老板和客户发现问题之前得到及时、有效的通知”。假定故障通知来自老板,我想大家都不会很愉快的。Nagios为了方便我们的管理工作,提供了至少3种表现形式。
*Web方式。即通过浏览器看看被监控的对象。在正常状态下,其状态(status)是以蓝色填充并显示一个OK。
*邮件通知。发生故障时,到达设定重试次数或探测间隔时间后发送邮件给管理员或相关人员,报告问题的大致情况。
*手机短信。这是非常有用和及时的功能了。晚上熟睡中,不可能看看Web页面或查阅邮件。可是一旦发生故障,手机短信却能把你随时唤醒。
一般情况下,这三者是同时进行的:上班时间开个浏览器查看页面显示、打开邮件程序定时收取邮件、手机24小时在线。
下面,我们以一个实际场景来展示Nagios的强大功能,希望对大家的系统管理工作有所帮助。