TEMPLATE RUNBOOK MAINTENANCE
Prérequis
- Infos hébergement, DNS et accès documentés (sans secrets en clair)
- Contacts urgence agence et client identifiés
- Outils monitoring connus (Vercel, Uptime, Sentry)
- Procédure de deploy et rollback validée une fois en staging
Quand le site tombe un vendredi soir, personne ne devrait chercher dans Slack qui appeler ou comment purger le cache. Un runbook Notion indique qui contacter, quoi vérifier, comment rollback et documenter l'incident. Vous allez structurer un template réutilisable par client, avec procédures testées et liens monitoring.
Structurer le runbook
Page racine « Runbook [Client] — [Site] » avec sommaire. Section Contacts urgence : agence (astreinte), client IT, hébergeur, créneaux SLA.
Section Health checks : URLs à surveiller, dashboards (status Vercel, ping API). Seuils d'alerte et qui réagit.
Section Incidents courants : site down, formulaire HS, lenteur, certificat SSL. Pour chaque cas : symptômes → vérifs → actions → escalade.
Documenter deploy, rollback et maintenance
Procédure montée de version : branche, preview, validation, promote prod. Lien vers CI/CD et checklist recette allégée si hotfix.
Rollback : tag ou deployment précédent, commande ou clic dashboard, délai de propagation CDN. Testez une fois et notez le temps réel.
Calendrier maintenance : fenêtres autorisées, dépendances (Node, CMS), qui approuve côté client.
Post-incident et vivant
Template post-incident : timeline, cause racine, correctif, action préventive, owner. Liez au changelog runbook.
Après chaque incident réel : mettez à jour le runbook sous 48 h. Page « Historique incidents » pour audit.
Revoyez trimestriellement : contacts valides, procédure deploy inchangée, liens monitoring OK.
Erreurs fréquentes
Runbook copié d'un autre client sans adapter URLs et contacts.
Procédures trop techniques pour l'astreinte client : prévoir une version « niveau 1 » simplifiée.
Pas de lien depuis le wiki handover : le runbook introuvable en urgence.
Oublier le fuseau horaire des astreintes agence vs. client international.
Ce qu'il faut retenir
Contacts, health checks, incidents types, rollback, escalade.
Secrets dans un coffre ; procédures testées au moins une fois.
Mise à jour post-incident obligatoire.
Lien depuis wiki handover client ; revue trimestrielle.
FAQ
Interne client IT + agence. Partage Notion invité ou section dédiée du wiki handover. Pas de publication web ouverte si infos sensibles.
Le handover couvre la passation globale. Le runbook est le document d'urgence opérationnelle, lié depuis le handover.
Décrivez où les trouver (coffre, personne référente), pas les identifiants en clair dans Notion.