本文是Unix/Linux系统管理自动化系列中的一篇,主要讲述如何实现自动化监控系统日志中的错误以及警告信息并及时通知系统管理员.
系统日志Unix/Linux中一个非常重要的功能组成部分.它可以按照某种规范记录下系统所产生的所有行为.我们可以使用系统日志所记录的信息进行系统排错,系统性能优化,或者根据这些信息调整系统的行为.另外,系统日志还可以为系统的安全管理提供重要的信息.
不同的操作系统可能会使用不同的日志方式,如AIX的Error log和Linux的syslog/syslog-ng.本文将分别论述在AIX上对Error log的监控和在Linux上对syslog/syslog-ng的监控.
AIX Error log 简介及其自动化监控机制
大部分的 Unix/Linux 系统都使用 syslog 作为系统日志方式,AIX 也支持 syslog 机制,但是 AIX 操作系统及其主要应用程序相关的日志都使用 Error log 来记录日志,只有少量的应用程序使用 syslog.AIX syslog 和 Linux syslog 的功能以及配置非常类似,在此不再重复论述.
AIX Error log 机制是 AIX 基本系统 (Base Operating System) 的一部分,在缺省安装情况下无需进行任何配置即可使用 AIX Error log 机制.
AIX Error log 机制组件
AIX Error log 机制主要由以下几个部分组成:
- 设备文件 /dev/error: 用于接收内核以及应用程序产生的日志信息.
- 守护进程 /usr/lib/errdemon:在系统初始化时自动启动,监控内核以及应用程序传递给设备文件 /dev/error 的日志信息,并将日志信息计入日志文件.
- 日志文件 /var/adm/ras/errlog:缺省日志文件.日志文件位置可以通过命令 /usr/lib/errdemon – i 进行配置
- 辅助程序:除了设备文件、守护进程和日志文件外,AIX Error log 还提供了丰富的辅助程序对 Error log 进行配置、操作、分析和生成报告.在下面的章节中会对各辅助程序进行详细的说明.
AIX Error log 配置
AIX Error log 可以在不进行任何配置的情况下使用 缺省配置基本上可以满足各种场景的使用需求,但 AIX 仍然提供了配置接口.通过配置接口可以修改设备文件 /dev/error 的缓冲区尺寸、日志文件的位置、日志文件的尺寸限制以及对重复日志的处理等等.AIX Error log 通过命令 /usr/lib/errdemon 进行配置.
拥有帝国一切,皆有可能。欢迎访问phome.net
- 修改 Error log 设备的缓冲区大小
Error log 设备 /dev/error 为块设备,需要使用缓冲区进行读写.缺省情况下,/dev/error 的缓冲区大小为 8KB,我们可以通过 /usr/lib/errdemon – B 来配置 /dev/error 的缓冲区大小.如果新配置的缓冲区大小大于现有的配置,新配置将会立即生效;如果新配置的缓冲区大小小于现有的配置,则新配置会在 errdemon 重新启动后生效.
- 配置日志文件路径
缺省情况下,AIX Error log 会使用文件 /var/adm/ras/errlog 存储日志信息,使用 /usr/lib/errdemon – i 可以配置 Error log 日志文件的路径.新配置的日志文件路径会立即生效.
- 配置日志文件大小限制
AIX Error log 的日志文件大小是可配置的,配置命令为 /usr/lib/errdemon – s.如果新配置的日志文件大小大于现有的配置,新配置将会立即生效;如果新配置的日志文件大小小于现有的配置,则现有的日志文件将会被备份为 *.log,然后 errdemon 会用新的日志文件大小配置生成一个新的日志文件.
- 配置对重复条目的处理
如果操作系统或者应用程序发生了重复的信息或者错误,在 Error log 中就会造成重复的条目.AIX Error log 对重复的条目会进行相应的处理,如在一定时间内内容相同的条目将会被标记为重复,如果重复的条目数超过了预先设置的阈值,则新的重复的条目将不会再作为重复条目被记入 Error log.是否打开重复条目处理功能的配置参数为 /usr/lib/errdemon – d,重复条目的时间间隔配置参数为 /usr/lib/e |