Un bug dans l’automatisation de DynamoDB était à l’origine du dernier gros crash d’AWS

Amazon a publié un rapport assez détaillé sur l’interruption massive de ses services (AWS) survenue le 20 octobre. Le crash, qui a rendu inaccessibles de nombreuses pages web, applications et jeux, trouve son origine dans un bug dans votre logiciel Plateforme d’automatisation DynamoDB, où vos clients AWS stockent les données. N’oubliez pas que les services cloud d’Amazon alimentent une grande partie d’Internet, avec ses GPU NVIDIA H100 et ses puces IA personnalisées fabriquées par Intel.

Le rapport explique que cet échec initial a déclenché des problèmes de chaîne dans d’autres systèmes Amazon Web Services qui dépendent dudit logiciel. DynamoDB, qui gère des centaines de milliers d’enregistrements DNS est conçu pour résoudre automatiquement tout incident. Mais il semble que ce ne soit pas le cas.

Une panne de chaîne qui a nécessité une intervention manuelle

Selon l’entreprise, une erreur dans le système de gestion DNS de DynamoDB a provoqué sa génération un enregistrement DNS vide pour les centres de données Amazon en Virginie du Nord. Le problème s’est aggravé lorsque le mécanisme de réparation automatique, qui aurait dû corriger cette erreur, est tombé en panne. Cela a obligé le personnel d’Amazon à résoudre le problème manuellement. Pendant que le problème était actif, tous les systèmes qui devaient se connecter à DynamoDB n’ont pas pu le faire et ont connu des échecs DNS.

La liste des services concernés était longue et comprenait Amazon lui-même, ses appareils Alexa, Bank of America, Reddit, Canva, Snapchat, Disney+, Apple Music, Fortnite, PlayStation et Lyft, entre autres. Comme indiqué dans Engadgetont même concerné les produits connectés, comme les lits intelligents, qui se connectent à Internet pour régler leur température. Certains de ces services ont mis du temps à répondre, tandis que d’autres étaient totalement inaccessibles. Sans doute un douloureux rappel de la dépendance de ces géants vis-à-vis de nuage.