微软公布大量服务中断调查原因:Azure测试正常的服务上线后出现BUG

昨天微软大量在线服务尤其是商业性服务出现中断,中断持续时间从2019年11月20日 00:57 UTC到03:30 UTC。

这些在线服务出现中断的原因在于Microsoft Azure 故障,微软大量服务全部都运行在自家的共有云计算平台上。

所以在云计算平台出现故障后这些在线服务无法访问其服务器和边缘节点,对于用户发出的访问请求也无法处理。

微软公布大量服务中断调查原因:Azure测试正常的服务上线后出现BUG

上图为受影响的Microsoft Azure区域

测试期间未发现故障但上线后出现故障:

微软公布的Microsoft Azure 云计算平台故障初步调查结果显示,安全入口出现故障导致数据无法交付边缘节点。

安全入口是微软云计算平台提供的安全可信的连接点,所有数据通过这个入口进入云计算平台再分发到边缘节点。

微软表示这个入口为该公司全局网络提供边缘缓存和网络服务,因此在出现故障后也影响到微软大量的在线服务。

该公司表示并非所有的服务都受到这次故障的影响,因为监测到故障后部分服务启动故障自动迁移得以快速恢复。

而出现故障的安全入口在定期部署的初始安全检查中并未出现问题,于是微软工程师将服务推送到生产环境运行。

故障发生后该服务启动回滚:

监测到故障后微软工程师迅速将安全入口服务回滚到旧版本,在紧急故障无法找到原因时回滚是最快的解决办法。

微软表示在2019年11月20日02:40UTC完成回滚流程 ,  此后受影响的服务逐渐开始恢复并在03:30UTC完成恢复。

还有少部分在线服务的恢复时间比预期要长因此用户访问可能还有问题,不过随着时间的推移目前均已恢复正常。

最后微软表示将在72小时内发布Microsoft Azure FrontDoor安全入口故障的详细调查信息确定故障的具体原因。

本文来源 蓝点网,由 山外的鸭子哥 整理编辑,其版权均为 蓝点网 所有,文章内容系作者个人观点,不代表 蓝点网 对观点赞同或支持。如需转载,请注明文章来源。
2
topgamer
限时免费领取正版套装:全方位PDF软件文电通PDF 5正版套装
哇哦恭喜您已成功屏蔽了蓝点网的小广告
扫码关注蓝点网微信公众号

评论:

5 条评论,访客:5 条,站长:0 条
  1. 神齐
    神齐发布于: 
    Chromium Edge 80.0.334.2 Chromium Edge 80.0.334.2 Windows 10 64位版 Windows 10 64位版

    论测试环境与生产环境的差异。🤣

  2. Mr Han
    Mr Han发布于: 
    蓝点网小程序版 蓝点网小程序版 微信浏览器 微信浏览器

    有测试的?

  3. topgamer
    topgamer发布于: 
    Google Chrome 78.0.3904.108 Google Chrome 78.0.3904.108 Windows 10 64位版 Windows 10 64位版

    这次影响到的是拥有话语权的商业用户,应该会调查的比较彻底吧

  4. bakura1
    bakura1发布于: 
    Google Chrome 77.0.3865.90 Google Chrome 77.0.3865.90 Windows 10 64位版 Windows 10 64位版

    巨婴说的测试,不打可信真的有认真测试。

  5. fudashuai
    fudashuai发布于: 
    Maxthon 5.3.8.2000 Maxthon 5.3.8.2000 Windows 10 64位版 Windows 10 64位版

    经受不住考验啊!

发表评论