La panne de Facebook révèle les limites du stockage des données en ligne

[ 5 ] Commentaires
Share

Pendant le week-end, certains utilisateurs de Facebook ont commencé à rencontrer des problèmes avec leurs photos. Certaines photos ne voulaient pas s’afficher, tandis que d’autres étaient remplacées par un point d’interrogation en lieu et place de la photo. En fait, le problème a été causé par le crash d’une unité de stockage sur laquelle les photos étaient stockées. La panne a malgré tout touché 10 à 15 pour cent des photos, ce qui est conséquent, étant donné la quantité de photos que contient Facebook (plusieurs milliards, largement devant Flickr). Toutefois, un billet sur le blog de Facebook est venu rassurer les utilisateurs en leur promettant que leurs photos étaient sauvegardées en de multiples endroits, et donc qu’elles seraient bientôt de retour en ligne.

Facebook_Fail

Le problème du stockage des photos sur Facebook

Selon l’entreprise, lors d’une mise à jour de vendredi soir, ils ont dû faire face à des problèmes de stockage de photos. Le problème qui s’est posé est que plusieurs disques durs ont arrêté de fonctionner en même temps. Parce qu’une défaillance matérielle simultanée comme celle-ci est très rare, Facebook a expliquer être encore en train d’essayer de comprendre ce qui a pu se passer.

Dans l’intervalle, cependant, les photos sont copiées sur de nouveaux disques durs – un processus qui peut prendre un certain temps en raison de la grande quantité de données à avoir été touché. Facebook assure donc à ses utilisateurs qu’ils n’ont pas à s’inquiéter, car le processus de stockage est tel qu’il prévoit ce genre de panne multiple. Le retour à la normale est prévu pour le début de cette semaine.

Le web dans les nuage est encore loin d’être parfait

Ce dernier rebondissement dans le monde des services web populaires nous ramène à la question de la confiance apportée à ce genre de sites. Et oui, parce que quand ce n’est pas Facebook qui a un problème avec le stockage de ses photos, c’est Gmail qui ne fonctionne pas pendant plusieurs heures, ou encore Ma.gnolia qui perd un teraoctet de données.

Or, même si Google a remboursé certaines entreprises pour la défaillance, ces nombreux problèmes montrent en particulier qu’il est très difficile pour une entreprise de chiffrer la perte qui peut être dûe à un service qui n’est pas directement lié à sa production ou à ses propres clients. De plus, les pannes de Gmail et de Facebook ont montré que le web d’aujourd’hui introduit une idée assez fausse qui est celle de la sécurité des données chez le fournisseur de service. Or, et c’est la différence avec le web d’il y a quelques années, où l’on conservait systématiquement des copies de ses documents personnels sur son ordinateurs, avant même de penser à les mettre en ligne (on utilisait un client mail tel que Thunderbird ou Outlook, on stockait d’abord les photos sur son ordinateur, puis on les envoyait éventuellement sur le net).

Pour être sûr, utilisez plus d’un service !

Au delà de la solution que je décrivais ci-dessus (stocker d’abord ses documents sur son ordinateur, puis après les mettre en ligne), le meilleur conseil que l’on peut actuellement donner est celui de multiplier les services que l’on utilise, et introduire une redondance dans ces services, de manière à n’être pas ou très peu affecté si l’un de ces services est en panne.

Aujourd’hui, un certain nombre de services allant dans ce sens existent, tels que Pixelpipe, qui vous permet d’envoyer vos ressources (photos, videos, etc.) sur un grand nombre de sites web simplement en passant par PixelPipe. Ce principe, s’il permet aux internautes de gagner beaucoup de temps, leur permet également de maintenir la même base de donnée de photos et de vidéos (mais aussi de documents bien sûr avec Google Docs, Zoho et/ou des sites tels que Scribd ou Docstoc), ce de manière transparente, puisqu’ils n’ont à réaliser qu’un seul envoi pour tous les sites.

Pour finir, je ne pourrai jamais dire que les données qui sont stockées en ligne sont sûres et que vous pouvez avoir confiance en leur disponibilité. Non : quoi que l’on fasse, la probabilité que ces services tombent en panne n’est jamais nulle, et donc la possibilité existe que tous ces services subissent des pannes en même temps. Mais plus vous multipliez le nombre de services, plus vous diminuez la probabilité d’être gêné pas une panne simultanée.

Cet article a d’abord été publié sur Web30.fr, mais j’ai décidé de fermer ce blog (autrefois dédié exclusivement aux Applications en ligne et au Cloud Computing), car je n’avait pas le temps de le mettre régulièrement à jour, et que finalement, il faisait doublon avec AbriCoCotier. Donc, avant de le fermer, je transfère ici les meilleurs articles.

Vous serez peut-être intéressé :

5 commentaires sur ce billet

  1. PatatoOor dit :

    Même si sur le fond tu as raison, je ne vois pas trop le problème de Facebook si justement ils ont un système de multiple sauvegarde, ce serait inconcevable que de tels services n’en aient pas.
    Je suppose que pour GMail c’est la même chose, leur modèle ne survivrait pas si un crash majeur de leur système venait à perdre les données des gens. Même si GMail a eu quelques soucis je crois mais de faible ampleur.
    Ces compagnies doivent gérer un nombre énorme de données d’utilisateurs de plus en plus nombreux, donc je pense que techniquement ça doit tout de même être un sacré challenge et qu’ils s’en acquittent plutôt bien.

    RépondreRépondre
  2. Louis dit :

    @PatatoOr : Pas d’accord : c’est le boulot des ingé systèmes de s’assurer que les redondances mises-en-places localement fonctionnent correctement (par exemple en remplaçant en temps et en heure les HDD crashés). Après, je ne crois pas que ce soit si difficile de faire de la redondance en informatique, avec tous les systèmes dont on dispose à l’heure actuelle. Le plus gros challenge, je crois, c’est de s’approvisionner correctement en matériel (pour changer le matériel défectueux), et en hommes (parce qu’il faut bien des gens pour changer tout ça).

    RépondreRépondre
  3. PatatoOor dit :

    Oui mais là il n’y a eu aucune perte de données, tout au plus quelques minutes ou heures d’indisponibilité.
    Quand on voit le nombre de personnes présentes sur facebook ou gmail, le temps qu’ils y passent, les interactions qui s’y produisent, les photos envoyées, … pour un service qui reste en pleine expansion et de façon très rapide, je pense qu’ils s’en sortent bien quand même !

    RépondreRépondre

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *