
亚马逊网络服务的中断导致多个主要网站无法访问,其中包括 Disney+、Reddit、麦当劳应用程序和联合航空等

亚马逊网络服务(AWS)在周一经历了一次重大故障,影响了包括 Disney+、Reddit 和联合航空在内的众多主要网站和应用程序。此次中断是由于 DynamoDB 的 API 端点出现 DNS 解析故障,导致超过 70 个 AWS 产品的错误率和延迟增加。AWS 工程师努力缓解问题,大部分服务在太平洋夏令时间凌晨 3:35 恢复,全面功能在太平洋夏令时间早上 6:00 实现。此次故障是操作性问题,而非安全相关,影响了全球多个行业,包括银行和基于云的平台
亚马逊公司 (NASDAQ:AMZN),亚马逊网络服务 在周一确认其在美国东部地区(北弗吉尼亚州)发生了广泛的操作中断,导致多个云服务的错误率和延迟增加——这是该公司最大和最关键的数据中心。
在太平洋夏令时间 12:11,AWS 工程师开始调查影响多个服务的错误率和延迟,包括 EC2、DynamoDB、Lambda、RDS、ECS 和 Glue。
一个小时内,公司确认问题源于 DynamoDB 的 API 端点的 DNS 解析失败,这影响了许多依赖系统和全球服务,如 IAM 更新和 DynamoDB 全球表。
另请阅读:亚马逊 AWS 首席执行官暗示重大 AI 进展
在太平洋夏令时间 2:22,AWS 已采取初步缓解措施,并开始看到 “早期恢复迹象”。客户被建议在 AWS 努力清除服务积压时重试失败的请求。
在太平洋夏令时间 3:35,AWS 宣布已完全缓解 DNS 问题,恢复大部分服务操作至正常状态。然而,在一些可用区,新 EC2 实例的启动仍然面临与容量相关的错误,因为公司实施了额外的恢复措施。
在太平洋夏令时间 4:00 至 6:00 之间,AWS 逐步恢复了所有受影响区域的完整功能。工程师重新启用了新 EC2 实例的启动,处理了 EventBridge 和 CloudTrail 的积压,并规范化了 Lambda SQS 事件映射。
公司建议客户启动新 EC2 实例时不针对特定可用区,以便 AWS 自动选择可用容量。到太平洋夏令时间 5:48,AWS 确认稳步进展,并报告 “现在大多数请求都成功。”
此次服务中断影响了 70 多个 AWS 产品,并在全球范围内干扰了多个主要网站和应用程序。AWS 表示,该问题是操作性问题——而非安全相关——其工程团队在 “多个平行路径上工作以加速恢复。”
此次停电波及多个行业,暂时导致亚马逊、华特迪士尼公司 (NYSE:DIS) Disney+、Lyft Inc (NASDAQ:LYFT)、麦当劳公司 (NYSE:MCD) 应用、纽约时报公司 (NYSE:NYT)、Reddit Inc (NYSE:RDDT)、Ring、Robinhood Markets, Inc(NASDAQ:HOOD)、Snap Inc (NYSE:SNAP) Snapchat、T-Mobile US, Inc (NASDAQ:TMUS)、联合航空控股公司 (NASDAQ:UAL)、Venmo 和 威瑞森通信公司 (NYSE:VZ) 的访问中断,CNBC 报道。
包括 Gov.uk 和 HM Revenue 及 Customs 在内的英国政府网站也出现了离线情况。
劳埃德银行集团 确认了服务中断。
搭乘 联合航空 和 达美航空公司 (NYSE:DAL) 的乘客也报告了在办理登机或访问预订时遇到困难。
像 Roblox Corporation (NYSE:RBLX)、Fortnite、Coinbase Global, Inc. (NASDAQ:COIN)、Canva 和 Perplexity AI 等基于云的平台均报告了中断。
价格动态: AMZN 股票在周一最后一次检查时上涨 0.69%,报 214.47 美元。
- 亚马逊强大的 AWS 定制芯片将获得升级——这有何重要性?
图片来源:Shutterstock

