Uptime et Monitoring : Surveiller la Disponibilité de son Site
Votre site est-il toujours en ligne ? Sans monitoring, vous ne le saurez qu'en recevant un email de client mécontent. Voici comment surveiller la disponibilité de votre site.
C'est quoi l'uptime et pourquoi ça compte
L'uptime, c'est le pourcentage de temps pendant lequel votre site est accessible. Un uptime de 99,9 % signifie que votre site peut être hors ligne pendant environ 8 heures et 45 minutes par an. Ça semble beaucoup ? C'est pourtant le standard de l'industrie. Un uptime de 99,99 % (les fameux "quatre neuf") réduit ce temps à 52 minutes par an. Pour un blog personnel, quelques heures de downtime par an ne sont pas dramatiques. Pour un site e-commerce, chaque minute d'indisponibilité se traduit en ventes perdues. Amazon perd environ 12 millions de dollars par heure de downtime. À votre échelle, si votre boutique fait 3 000 euros par mois et qu'elle est hors ligne 8 heures, vous perdez environ 33 euros. Ça s'additionne. Le problème, c'est que sans monitoring, vous ne savez pas quand votre site tombe. Il peut être hors ligne pendant 2 heures à 3 heures du matin sans que vous le sachiez, et sans que votre hébergeur vous prévienne. C'est là que les outils de monitoring entrent en jeu.
99,9 % vs 99,99 % : comprendre le SLA
Le SLA (Service Level Agreement) est l'engagement de disponibilité de votre hébergeur. La plupart garantissent 99,9 % d'uptime, certains vont jusqu'à 99,99 %. Voyons ce que ça représente concrètement sur un an. Un SLA de 99 % autorise 3 jours et 15 heures de downtime. C'est insuffisant pour tout site sérieux. 99,9 % autorise 8 heures et 45 minutes. C'est le standard acceptable. 99,95 % autorise 4 heures et 22 minutes. C'est ce que proposent les bons hébergeurs. 99,99 % autorise seulement 52 minutes. C'est le haut de gamme, réservé aux infrastructures cloud comme AWS ou Google Cloud. Attention : le SLA ne signifie pas que votre site sera toujours en ligne. C'est un engagement contractuel avec des compensations (généralement des crédits) si l'objectif n'est pas atteint. Encore faut-il prouver le downtime, d'où l'importance du monitoring externe. Chez certains hébergeurs mutualisés, le SLA est absent ou vague. Chez Kinsta, il est clair : 99,9 % avec compensation. Chez Hetzner, 99,9 % pour les VPS cloud.
UptimeRobot : le monitoring gratuit de référence
UptimeRobot est le service de monitoring le plus populaire, et pour une bonne raison : le plan gratuit est très généreux. Vous pouvez surveiller jusqu'à 50 sites avec des vérifications toutes les 5 minutes. L'outil envoie une requête HTTP à votre site et vérifie qu'il répond correctement. Si votre site ne répond plus, vous recevez une alerte par email, SMS, Slack, Telegram ou webhook. La configuration prend 2 minutes : créez un compte, ajoutez l'URL de votre site, configurez vos alertes, c'est fait. Le tableau de bord montre l'historique d'uptime avec des graphiques clairs. Vous pouvez aussi créer une page de statut publique (status.monsite.fr) pour informer vos utilisateurs en cas de panne. Le plan gratuit vérifie toutes les 5 minutes, ce qui signifie que dans le pire cas, un downtime est détecté après 5 minutes. Le plan Pro à 7 dollars par mois réduit l'intervalle à 1 minute et ajoute le monitoring SSL, le monitoring de mots-clés et des rapports avancés. Pour la majorité des sites, le plan gratuit est largement suffisant.
Alternatives : Hetrix Tools, Better Uptime
Hetrix Tools est une excellente alternative à UptimeRobot avec un plan gratuit qui surveille 15 moniteurs avec des vérifications toutes les 1 minute, plus rapide que le gratuit d'UptimeRobot. Il propose aussi le monitoring de blacklist (votre IP est-elle blacklistée par les filtres anti-spam), ce qui est précieux si vous envoyez des emails depuis votre serveur. Better Uptime (rebaptisé Better Stack) combine le monitoring d'uptime avec la gestion des incidents et les pages de statut. L'interface est plus moderne et les alertes sont mieux gérées avec un système d'escalade. Le plan gratuit inclut 10 moniteurs. Le plan payant à 25 dollars par mois ajoute le monitoring de logs et les métriques serveur. Pingdom, racheté par SolarWinds, est la solution historique mais payante uniquement à partir de 15 dollars par mois. StatusCake propose un plan gratuit avec 10 moniteurs. Pour un monitoring plus technique incluant les métriques serveur (CPU, RAM, disque), des outils comme Netdata (gratuit, open source) ou Datadog (payant, entreprise) complètent le monitoring d'uptime simple.
Configurer ses alertes intelligemment
Un monitoring sans alertes bien configurées ne sert à rien. Et des alertes trop sensibles deviennent du bruit que vous finirez par ignorer. Voici comment configurer vos alertes intelligemment. Ne vous alertez pas sur chaque timeout isolé. Un serveur peut rater un check occasionnel sans que votre site soit réellement down. Configurez une alerte après 2 ou 3 checks échoués consécutifs, soit 10 à 15 minutes avec UptimeRobot gratuit. Diversifiez les canaux d'alerte. Un email risque de passer inaperçu à 3 heures du matin. Ajoutez une alerte Telegram ou une notification push sur votre téléphone pour les incidents critiques. Si vous travaillez en équipe, configurez un canal Slack dédié aux alertes. Créez des alertes pour le certificat SSL aussi. UptimeRobot Pro et Hetrix surveillent l'expiration de votre certificat SSL et vous préviennent 30 jours avant. Un certificat expiré affiche un avertissement de sécurité effrayant pour vos visiteurs. Surveillez aussi le temps de réponse, pas seulement la disponibilité. Un site qui répond mais met 10 secondes est quasi aussi problématique qu'un site down.
Que faire quand votre site tombe
Votre alerte de monitoring vient de sonner. Pas de panique, suivez ces étapes. Vérifiez d'abord que c'est bien votre site qui est down et pas votre connexion internet. Utilisez isitdownrightnow.com ou demandez à quelqu'un d'autre de vérifier. Ensuite, identifiez la cause. Connectez-vous à votre hébergeur et vérifiez le statut de votre service. Un mutualisé surchargé, un VPS qui a manqué de RAM, un certificat SSL expiré, une attaque DDoS... les causes sont variées. Consultez la page de statut de votre hébergeur pour voir si le problème est de leur côté. Si c'est un problème serveur chez votre hébergeur, ouvrez un ticket de support en mentionnant les détails : depuis quand le site est down, les erreurs observées, votre outil de monitoring comme preuve. Si c'est un problème sur votre site, comme un plugin WordPress qui plante, accédez à vos fichiers via FTP et renommez le dossier du plugin fautif. Documentez chaque incident : durée, cause, résolution. Ces données vous aideront à évaluer la fiabilité de votre hébergeur et à décider si une migration est nécessaire.