L'entreprise explique qu'un problème de configuration est à l'origine des perturbations ayant touché de nombreux services en ligne ce dimanche 2 juin et va procéder à un audit pour éviter qu'une telle situation ne se reproduise.
Quelques jours seulement après la panne ayant touché de nombreux services en ligne hébergés par Google Cloud, le moteur de recherche revient sur l'incident sur son blog et donne quelques indications sur la cause du bug ayant touché des millions d'utilisateurs.
Un changement de configuration qui a entraîné une congestion du réseau
Google explique qu'une mise à jour de la configuration de quelques serveurs a posé problème : elle a causé une réaction en chaîne et diminué la capacité réseau de ces derniers de plus de 50 %. Le trafic n'a pas pu, de ce fait, être réparti correctement et a entraîné une congestion qui a paralysé de nombreux services à forte consommation de bande passante.Le problème a été repéré en quelques secondes par les ingénieurs de Google Cloud, mais la résolution technique du problème, qui avait été estimée à seulement quelques minutes, a pris plusieurs heures avant d'être accomplie.
Des millions d'utilisateurs impactés
Google donne quelques exemples de l'impact qu'a eu cette perturbation. YouTube a enregistré une baisse de 2,5 % du nombre de visites pendant une heure, tandis que Google Cloud Storage a enregistré une réduction de 30 % du trafic. Environ 1 % des utilisateurs actifs de Gmail ont également rencontré des problèmes avec leur compte. Google Search n'a quant à lui subi qu'un léger ralentissement lors de l'incident.Si ces chiffres paraissent minuscules, ils représentent des millions d'utilisateurs, à l'échelle de Google, qui n'ont pas pu accéder correctement à leurs boîtes Gmail ou à leur compte Spotify.
Les équipes techniques de Google sont désormais à pied d'œuvre pour analyser les raisons de ce bug et mettre à jour l'infrastructure afin d'éviter à l'avenir qu'un tel bug puisse survenir à nouveau.