2022年,Rogers 的用户们经历了一场超大型的断网事故,大约有1200万人无法使用无线和有线服务。
最近的一项调查显示,这场事故并非天灾等不可抗力导致,而是因为员工删除了关键组件。同时,管理和系统的“缺陷”导致断网的问题进一步恶化。
(cbc)
这场持续15小时的大断网始于7月8日傍晚,导致个人和企业无法使用移动电话、家庭电话、互联网和911服务。
加拿大广播电视和电信委员会(CRTC)于2023年9月委托Xona Partners进行审查,确定中断的原因。
这份报告最近流出,摘要部分指出:在中断前的几周,Rogers 正在进行一个包括七个阶段的程序来升级网络,断网发生在第六阶段。而由于网络更新的前五个阶段未发生任何问题,因此“风险评估算法降低了第六阶段的风险等级”。
根据报告,事发当天 Rogers 公司的工作人员删除了一个过滤器。它的作用是将信息导向适当目的地。如果没有过滤器,大量信息就会被发送至 Rogers 的核心网络,在几分钟内就会导致系统超载和崩溃。这也是这次断网的主要原因。
而在修复期间, Rogers 的员工在中断开始后14小时才能访问记录了中断根本原因的关键错误日志,这“对中断恢复工作产生了不利影响”。
Rogers 的核心网络为公司内部、客户和服务提供商管理无线和有线数据的服务。而由于无线和有线服务共享同一个IP核心网络,因此中断的范围非常广泛,导致所有服务“灾难性丧失”。
不过报告同时也指出,Rogers 自中断以来采取的措施“足以改善罗杰斯网络的弹性和可靠性,并解决了2022年7月中断的根本原因”。
报告还提到,Rogers 已宣布将为其无线系统开发一个新的、独立的网络,同时保持有线服务在旧的核心网络上,这项工作正在进行中。
Rogers 方面则拒绝了媒体的采访请求。它发表声明坚称其网络是“最可靠的网络”,并表示将继续投资,“让加拿大人享受世界上最好的网络”。
Rogers 表示:“我们完成了对我们网络的全面审查,加强了我们的网络弹性,并实施了这份报告的所有建议。”
信息来源:https://www.cbc.ca/news/politics/rogers-outage-human-error-system-deficiencies-1.7255641