监测Linux系统10条最佳成功经验

作者佚名技术来源 Linux系统浏览 190 发布时间 2012-04-27

1. 定义所获得的“生产”资源的含义 - 一个服务器,一个应用或一种服务.

2. 找出满足此生产需求的监测方式.

3. 执行监测可能性,能通过手动方式也能借助开源工具,比如Nagios或其他商业工具.

4. 定义那些 “损坏、不存在、警惕” (broken/unavailable/on fire) 的含义 - 通常也被称之为警告、出错、危险 (warn/error/critical).

5. 在你的监测系统中执行警报以捕捉这些阈值.

6. 定义不同的警报级别所对应的处理流程.

7. 确保你的警报处理流程是和那些提示处理流程相符的.

8. 为各团队创建角色和责任来分摊和他们工作特性相符的警报、控制和细节操作.聚焦于个人通常意味着为他们的区域提供更好的绩效.

9. 为你整个系统中的警报、监测协议、角色等指定少数终极用户,以确保他们按照单一蓝本(blueprint)执行.

10. 如需要,则进行修正、清理和重复.

凌众科技专业提供服务器租用、服务器托管、企业邮局、虚拟主机等服务，公司网站：http://www.lingzhong.cn 为了给广大客户了解更多的技术信息，本技术文章收集来源于网络,凌众科技尊重文章作者的版权，如果有涉及你的版权有必要删除你的文章，请和我们联系。以上信息与文章正文是不可分割的一部分,如果您要转载本文章,请保留以上信息，谢谢!

分享到：更多

你可能对下面的文章感兴趣

上一篇: LINUX FSCK数据出错灾难应急方案下一篇: Linux磁盘和文件系统管理

关于监测Linux系统10条最佳成功经验的所有评论

随机推荐