AI时代的全链路监控,阿里工程师怎么做?

  • 时间:
  • 浏览:4
  • 来源:uu快3倍率_uu快3网游_单双计划

近年来,随着阿里新业务、新技术的快速发展,传统的业务总量“监控大盘”要是没法 没法 满足监控需求,主要表现在以下几只方面:

监控标准不统一:总爱以来“业务监控”全部前会 自定义的,依赖开发人员的每个人 经验,往往系统、业务监控混在同时,没法 标准,业务之间没法 比较;各系统监控能力参差不齐,很容易出显业务链路中的监控断层;业务监控缺少一套行之有效的法子论,新人要是新业务对于业务要为啥监控,告诉我要怎样下手、告诉每个人 配的监控否是覆盖全面,没法 等到故障处在前一天

过高 全局视角:“监控大盘”主要反映的是单个业务或应用的运行情形,缺少全局的业务视角能反应整个“业务域”的上下游整体的运行情形。比如交易系统成功率下跌,就看看是全部前会 优惠出问题报告 图片了,要是告诉我“优惠”的业务监控在哪里,没法 依赖"优惠"的同学去排查,钉钉电话沟通,一帮人 同时拼凑信息,上下游协调成本很高。