Технология

Крах облаков: Amazon раскрыла причину серьёзного сбоя в работе облачных сервисов

Amazon Web Services (AWS) заявила, что причиной недавнего массового отключения тысяч сайтов и приложений стал программный баг в системе автоматизации DNS-управления.

 

Облачное подразделение Amazon — AWS — опубликовало подробное объяснение масштабного сбоя, который на протяжении часов оставил без доступа к сервисам от мессенджера Signal до «умных» кроватей и банкинга.

Как выяснилось, первопричиной стало «латентное» (скрытое) дефектное состояние механизма автоматического управления DNS-записями в одном из дата-центров (регион US-East-1), который контролирует сотни тысяч записей. Ошибка привела к тому, что система не смогла автоматически восстановиться и потребовалось вмешательство оператора.

AWS пояснила: автоматизация должна была отслеживать обновление записей, распределение трафика и устранение сбоев оборудования. Однако из-за пустой DNS-записи в системе мониторинга произошёл каскадный сбой.

Инцидент подчёркивает масштабную уязвимость современной цифровой инфраструктуры: когда облачные сервисы становятся критически важными для банков, бизнеса, «умного дома», сбой одного элемента способен вызвать лавину последствий. Некоторые компании призывают этот случай напоминанием о важности резервирования и диверсификации.

AWS заявляет, что сбой не был кибератакой, однако эксперты считают, что даже без злого умысла такие ошибки вызывают серьёзные риски для доверия к облачным платформам и устойчивости цифровой экономики.

Для бизнеса, особенно в странах-импортёрах технологий и облачных услуг, вроде Казахстана, данный случай — сигнал задуматься о стратегии отказоустойчивости и о том, что даже крупнейшие провайдеры не застрахованы от цепных эффектов.