第一十二章 监控系统Nagios

第七节 监控错误日志实例

    1.目的

    (1)发现日志是否产生某个关键字(如系统日志的error)。

    (2)不从头重复检查。日志文件不停滚动,每次从头检查的话,会查到已经发现的错误,就不符合我们的需求。

    (3)发现新的关键字在日志中即发送报警。

    2.原理

    用Linux的diff工具,对比两个文件,并以grep提取我们要关注的“关键字”,如果有输出,则表明有异常,然后报警,再把源文件拿去覆盖对比的那个对象文件。

    3.实验

    (1)工具:Nagios插件check_log。

    (2)文件:/var/log/messages及/var/log/message.arc。文件/var/log/messages本不存在,是执行命令后自动生成的。

    我们先来看一下/var/log/messages 的内容:

     /var/log/messages 的内容

    4.结论和改进

    可以满足一定的需求,如以error做正则表达式来判断是否有错误产生。

    改进脚本,使其有一定量的error产生时,发送警告,多于一个量时,则发送critical告警。