Hier, le blog n’a pas été accessible entre 19h43 et 21h13 (heures relevées par l’outil de monitoring Monitis). J’ai donc mis facilement 3/4 d’heure à me rendre compte que le blog ne répondait plus (et encore, c’est un coup de chance que j’aie eu besoin d’y accéder à ce moment là), et trois autres quarts d’heures à le remettre debout, la faute à mon absence devant mon PC personnel (et donc le besoin de retrouver à droite à gauche les différents codes d’accès). Notez que ce genre d’événement fait sérieusement penser à passer sous AppEngine, par exemple sur Bloog, ce qui permettrait au moins d’éviter d’avoir à faire ce genre de maintenance.
J’avais reçu hier soir un premier mail de Monitis, me signalant l’arrêt d’AbriCoCotier, mais j’avoue que je n’y ai pas prété attention, croyant que c’était un n-ième mail de publicité de Monitis. Fail de ma part. En voulant me connecter sur AbriCoCotier dans la soirée, j’ai finit par me rendre compte que le blog était down, et plus exactement le serveur tout entier.
Je me suis donc connecté sur l’interface 1and1 pour demander un allumage du serveur (l’interface 1and1 me signalant que le serveur était éteint, mais ça n’avait pas l’air de les gêner…), allumage du serveur qui me faisait assez peur, dans la mesure où je n’avais pas accès au SSH sur la connexion où j’étais au moment du rallumage (en gros j’étais sur le Wifi de Microsoft, et le SSH n’avait pas l’air de passer…). Pour autant, environ une minute après la demande de rallumage, le blog était de retour comme si de rien n’était.
Ce que je ne comprend pas, c’est comment le blog a pu passer d’un état « éteint » à un état « tout fonctionnel » alors que 1and1 n’a pas accès au serveur en lui-même (la dernière fois qu’ils ont voulu faire une intervention dessus, ils n’ont pas pu à cause du changement de port pour le SSH et du rootlogin à Off). Je dis ça parce que mon serveur fonctionne avec un Nginx et un Apache en même temps, et donc je ne sais pas comment le serveur a été rallumé, mais en tout cas tout s’est remis en place comme s’il ne s’était rien passé. Je me demande donc d’où a bien pu venir l’arrêt du serveur (je me dis que l’arrêt est venu potentiellement de 1and1 qui l’aurait « mis en veille »), dans la mesure où, s’il était tombé sous un gros bug, une faille ou un DDoS, je pense qu’il ne serait pas revenu dans son état initial tout seul.