第一十二章 监控系统Nagios
第七节 监控错误日志实例
1.目的
(1)发现日志是否产生某个关键字(如系统日志的error)。
(2)不从头重复检查。日志文件不停滚动,每次从头检查的话,会查到已经发现的错误,就不符合我们的需求。
(3)发现新的关键字在日志中即发送报警。
2.原理
用Linux的diff工具,对比两个文件,并以grep提取我们要关注的“关键字”,如果有输出,则表明有异常,然后报警,再把源文件拿去覆盖对比的那个对象文件。
3.实验
(1)工具:Nagios插件check_log。
(2)文件:/var/log/messages及/var/log/message.arc。文件/var/log/messages本不存在,是执行命令后自动生成的。
我们先来看一下/var/log/messages 的内容:
4.结论和改进
可以满足一定的需求,如以error做正则表达式来判断是否有错误产生。
改进脚本,使其有一定量的error产生时,发送警告,多于一个量时,则发送critical告警。