创建告警模板
模板名称:表示定义的告警模板的名称。
模板类型:表示定义的告警模板类型普通告警策略模板或梯度告警模板策略。
告警接收组:表示定义的告警接收的用户组,可在“后台管理-->用户组”中进行配置管理。
告警接收人:表示定义的告警接收人。
告警类型:表示选择的告警类型,不通知、仅失败或全部。
告警方式:表示选择的告警方式,邮件、popo、stone或短信、电话。
模板描述:表示定义告警模板的描述信息。
1、普通告警策略模板。
表示可以在告警模板页面上设置项目的报警模版。普通告警策略:
- 若执行集执行计划的报警模版选择的是普通告警策略模板,则执行失败按照告警模板设置逻辑报警。
2、梯度告警策略模板。
表示可以在告警模板页面上设置项目的报警模版。
梯度告警策略:
若执行集执行计划的报警模版选择的是梯度告警策略模板,则某一次执行失败之后,则开始重跑,同时失败的次数+1。
若失败的次数等于L1设置的失败次数,则只对L1级别的接收人、接收组报警,责任人为L1报警接收人。
若失败的次数等于L2设置的失败次数,则对L1级别 L2级别的接收人、接收组报警,责任人为L1报警接收人。
若失败的次数等于L3设置的失败次数,则对L1级别 L2级别 L3级别的接收人、接收组报警,责任人为L1报警接收人。
若某一次执行集定时任务执行成功或重跑成功,失败次数清零,若执行计划暂停,则失败次数清零,不执行失败重跑报警逻辑。
聚合报警策略:
若是第一次触发告警时开始记录此执行集的聚合起始时间,非第一次触发,则检查距离上次记录的起始时间是否大于一个时间窗口,如果大于则重置起始时间为当前时间。对L1级别L2级别L3级别的接收人、接收组报警,责任人为L1报警接收人。
若在触发报警时检查执行集达到配置的报警次数且在时间窗口内触发聚合告警(原有的L1,L2,L3告警继续触发,聚合告警发送在L1,L2,L3之后),时间窗口重置为当前时间。对L1级别L2级别L3级别的接收人、接收组报警,责任人为L1报警接收人。
注:
(1) 短信报警:需接收人在"个人信息
"页面填写手机号。报警时间段:工作日22:00~次日07:00和周末全天。
(2) 电话报警:需接收人在"个人信息
"页面填写手机号(需手机号归属地为浙江省),并给账号添加至"后台管理
"->"电话告警白名单
"中(可联系产品管理员添加)。报警时间段:工作日22:00~次日07:00和周末全天,当使用“梯度告警策略模板”时,只会在L3时触发电话报警,其他策略不受影响。
(3) 聚合报警:需在"后台管理
"中配置触发聚合报警所需的报警次数(根据执行集定时任务执行时失败的任务数叠加)与触发聚合报警所需的时间范围(单位为分钟),只在使用"梯度告警策略模板"时有效。