互联网应用上线后,别忘记实现部署这些运维监控脚本

时间:2020-12-19 17:11:37
背景:
互联网应用,往往面临高并发、高可用等挑战,一但应用出现问题而没有及时发现,导致系统宕机,其损失是及其重大的。所以及时有效的监控到异常,并将异常及时通知相关责任人可以最大限度的降低损失。及时有效的监控到异常可以通过定时程序来实现,而异常及时通知功能目前最好是以短信的方式进行通知。

监控脚本类别:
1). 应用程序类
     a). 第三方程序接口可用性监控;这类监控主要是避免第三方程序失败导致应用体验差或者应用不可用
     b). 分析应用程序日志,监控数据库可连接性,如连续三次不可连接,发出告警提示"xxx数据库不可连接"
2). 数据库类
     a). 数据库表空间使用情况监控,使用表空间是否超过80%,超过提示告警
3). 内存类
     a). 内存使用空间是否超过80%
4). 磁盘类
     a). 应用中FTP磁盘阵列使用空间是否超过80%
     b). 磁盘IO性能监控,对频繁读写磁盘的应用就需要监控磁盘IO性能
5). 网络类
     a). 网络是否断开,一般网络断开大部分情况下是网络设备老化或者损坏