De l'aveu même de Facebook, c'est la pire interruption de service qu'ait connue le site sur les quatre dernières années. Après que les utilisateurs eurent constaté divers dysfonctionnements et ralentissements entre mercredi et jeudi, le numéro un mondial des réseaux sociaux a subi une interruption de service d'environ deux heures jeudi soir, entre 20h30 et 23h (heure française).
Sensible dans le monde entier, la panne a immédiatement suscité un flot de questions et de commentaires, aussi bien chez les accros au service que chez les professionnels du réseau. Dans le lot, certains avancent l'hypothèse d'une attaque par déni de service de grande ampleur. Selon les ingénieurs de Facebook, la réponse serait bien plus triviale : le site aurait été victime d'un simple problème informatique.
Plus tôt dans la journée, Facebook s'est révélé hors ligne ou inaccessible pour la plupart d'entre vous pendant environ 2 heures et demi. C'est la pire interruption de service que nous ayons rencontrée en plus de quatre ans, et nous voulions en premier lieu vous présenter nos excuses, a indiqué Robert Johnson, directeur de l'ingénierie logicielle chez Facebook, dans la nuit de jeudi à vendredi.
Il explique que la défaillance responsable de la sévérité de cette panne se situait au niveau d'un système automatisé chargé de vérifier la validité de certaines valeurs stockées en cache, pour éventuellement les remplacer par des données à jour. La configuration de ce système aurait été modifiée à de telle façon jeudi que chaque tentative de connexion au site entrainait la détection d'une valeur invalide et donc, une tentative de mise à jour de cette dernière. Facebook faisant face à un important afflux de visiteurs, le système de gestion des bases de données du site aurait été rapidement surchargé par ces requêtes en série.
Facebook assure avoir résolu le problème, mais indique avoir dû, à cette fin, couper l'accès au site, avant de le rétablir progressivement, ce qui explique pourquoi les utilisateurs se sont d'abord vus retourner des messages d'erreur lors de leurs tentatives d'interactions avec le service, avant de ne plus pouvoir y accéder pendant quelques dizaines de minutes.
Reste à savoir si cette panne aura eu un impact sur la productivité en entreprise aux Etats-Unis, le taux de natalité en Asie, ou l'audience des programmes de télévision du soir en France !