Fastly a publié son rapport d’incident concernant l’importante panne qui a touché de très nombreux sites internet le 8 juin dernier.
De nombreux médias ainsi que des plateformes telles que Twitch, Reddit ou Amazon ont été inaccessibles pendant de longues minutes à la suite d'un souci rencontré par la plateforme cloud qui a affecté ses réseaux de distribution de contenu.
Un bug qui aurait dû être anticipé, selon la firme
C’est Nick Rockwell, vice-président de l’infrastructure et de l'ingénierie de Fastly, qui a pris la parole. Il a confirmé que la panne avait été causée par un bug logiciel qui n’avait pas été détecté : « Le 12 mai, nous avons amorcé le déploiement d'un logiciel qui a introduit un bug pouvant être déclenché par une configuration spécifique d’un client dans certaines circonstances. »
Il ajoute : « Le 8 juin, un client a apporté un changement de configuration valide qui incluait les circonstances spécifiques qui ont déclenché le bug, ce qui a provoqué des erreurs sur 85 % de notre réseau. »
Fastly a pris connaissance du problème seulement une minute après qu’il n'est survenu, tandis qu’au bout de 45 minutes, 95 % de ses réseaux opéraient à nouveau normalement. Un correctif a finalement été apporté quelques heures plus tard. Désormais, l’entreprise procède à une analyse complète des processus et pratiques de l’incident et va tenter de déterminer pourquoi le bug n’a pas été détecté plus tôt. Fastly reconnaît par ailleurs qu’une telle panne aurait dû être anticipée.
« Nous fournissons des services essentiels et nous traitons toute action susceptible de causer des problèmes de service avec la plus grande sensibilité et priorité. Nous présentons nos excuses à nos clients et à ceux qui en dépendent pour cette panne et remercions sincèrement la communauté pour son soutien » conclut Nick Rockwell.
Source : Fastly