OneAlert 入门(二)——事件分析

时间:2024-03-24 22:05:14

OneAlert 是国内首个 SaaS 模式的云告警平台,集成国内外主流监控/支撑系统,实现一个平台上集中处理所有 IT 事件,提升 IT 可靠性。有了 OneAlert,你可以更快更合理地为事件划分优先级、分配路径,从而极大地提高团队的协作能力、优化协作流程。本文是 OneAlert 入门系列文章的第二篇,帮助你快速了解和配置 OneAlert,从而尽早解决系统宕机或 404 错误。

OneAlert 入门(二)——事件分析

事件分类

正如本系列第一篇文章所述,OneAlert 会自动根据主机、集群或自定义的标签将告警分组。分组完成之后,最重要的任务便是决定事件的优先级。这一过程被称为事件分类(incident triage),能确保团队合理地分配时间与资源。OneAlert 暂时提供一种简单的方法,提高团队协作能力:转发。

通过转发团队协作处理告警

当新告警产生时,首先先确定自己是否能够解决该告警。譬如,磁盘容量不足,而自己无释放容量的权限时,我们可以通过转发该告警给相关人员处理,将团队每个人的能力和权限价值最大化。OneAlert 提供的协作转发方式包括工单、客服、及时通讯等团队协作应用,确保告警能够通过适合的渠道发送给最佳处理人,提高团队协作能力。

OneAlert 入门(二)——事件分析

本篇除了介绍 OneAlert 的协作功能,还将介绍两个即将上线的新功能:非紧急事件告警再提醒功能和重要事件标星功能。

非紧急事件告警再提醒

当需要处理的告警很多时,我们无法第一时间解决全部的告警,所以我们必须根据事件的紧急程度对事件进行优先级分类处理,优先处理紧急事件,而对非紧急事件设置过一定时间后再次提醒。这样我们可以集中精力解决优先级高的事件,并且我们也无需担心忘记解决有限度低的事件。

轻松标记重要事件

当对事件进行优先级分类后,我们可以轻松找到最重要的问题,并且加以解决。同时我们可以对重要事件进行标星处理,可以让我们在下次轻松找到并查看所有优先级高的重要事件,免受非重要事件的干扰。

通过 OneAlert ,减少噪音干染,能优化协作效率,提高解决问题的速度。既然你已经了解了 OneAlert 事件流的基本功能,以及转发、即将上线的再提醒和标星功能,在第三部分,我们将会讨论事件分析功能。

本文转自 OneAPM 官方博客