Google est certainement l'une des firmes qui possèdent les infrastructures informatiques les plus importantes dans le monde. Grâce à ses milliers de serveurs et aux données qu'ils enregistrent, Google peut donner quelques informations intéressantes liées au matériel informatique. La firme a ainsi dévoilé les résultats d'un rapport (fichier PDF) commandé en interne en relation avec la durée de vie des Disques durs.
En règle générale, un utilisateur change son disque dur tous les 5 ans, malheureusement il arrive parfois que le disque dur qui contient nos précieuses (ou non) données finisse par défaillir avant cette période. La plupart du temps, des « conditions extrêmes » d'utilisation (température trop élevée, activité trop importante) sont citées comme raison principale de défaillance.
L'étude menée par Google nous donne plus de détails à ce sujet. Présenté lors d'une conférence sur « les fichiers et les technologies de stockage », le rapport de la firme au grand G conclut qu'un disque dur peut rendre l'âme pour des raisons aussi diverses que variées.
A l'heure actuelle, Google compterait plus de 450 000 serveurs, la plupart utiliseraient des disques durs « grand public » avec des capacités allant de 80 à 400 Go. L'étude de Google aurait porté sur plus de 100 000 disques qui sont entrés en fonctionnement pendant ou peu de temps après 2001. Ces disques 5400 ou 7200 tours/minute proviendraient « de divers grands fabricants de disques et regrouperaient neufs modèles principaux ».
Pour réaliser son étude, Google aurait consulté l'ensemble des informations « vitales » qu'il obtiendrait de ses serveurs. Des informations fréquemment mises à jour, à quelques minutes d'intervalle. Dans ce domaine, on peut notamment citer : les températures, les niveaux d'activités ou encore les paramètres SMART (Self-Monitoring Analysis and Reporting Technology), souvent utilisés pour déceler/prévenir des problèmes à venir sur un disque dur.
Google a remarqué, sans surprise, que le taux de disque dur défaillant à tendance à augmenter au fur et à mesure que le disque vieillit. Pendant la première année de leur mise en fonction, 1.7% des 100 000 disques durs employés par Google auraient ainsi du être remplacés. Ce pourcentage serait passé à 8% pendant la deuxième année et à 8,6% pendant la troisième année. Une fois entré dans sa quatrième année de vie, Google affirme que la durée de vie restante du disque dur est « davantage influencé par le modèle/marque que par son âge ».
En ce qui concerne les niveaux d'activités, Google précise que seuls les disques qui ont 6 mois de service (ou moins) ont une probabilité plus importante de défaillir lorsqu'ils sont très sollicités. Une fois ces premiers mois passés, la probabilité en question baisserait de manière graduelle après 1, 2, 3 et 4 ans. Après 5 ans de service, cette probabilité augmenterait de manière très significative.
Pour ce qui est de la température, la conclusion de Google est plutôt surprenante : « les pannes n'augmentent pas si la température moyenne est plus élevée. En réalité, le taux de panne le plus élevé est associé aux températures les plus faibles. Ce taux est légèrement supérieur dans les baies où les températures sont vraiment très élevées ».
Google rapporte que moins de 2% de ses disques ont été liés à des erreurs d'analyse de surface via le SMART. Les disques qui sont liés à ces alertes SMART auraient 10 fois plus de chance de tomber en panne. Google précise que 70% des disques qui ont fait l'objet d'une alerte SMART ont survécu les 8 mois qui ont suivi la première alerte.
La « réallocation des secteurs » (déplacement des données d'un secteur défectueux vers un secteur sain) serait aussi un symptôme significatif pour déceler une future panne globale d'un disque. Un disque avec ce genre de secteurs aurait ainsi 3 à 6 fois plus de chance de tomber en panne rapidement. Google précise toutefois que 85% de ses disques qui présentaient des secteurs défectueux ont survécu les 8 mois qui ont suivi la détection du premier secteur défectueux.
Google tempère ses propos en précisant que 56% des disques durs qui ont rendu l'âme n'ont fait l'objet d'aucune alerte SMART. Il faut donc déduire de tout cela que l'âge d'un disque dur est important et que la « panne » intervient bien souvent pendant les premiers mois de mise en fonctionnement ou plusieurs années après. On peut ajouter que le niveau d'activité des disques joue également un rôle important. Enfin, Google assure que les données fournies par SMART sont encore bien insuffisantes pour prédire correctement la possible panne d'un disque dur...