Plan de reprise d'activité : préparer une application à résister aux incidents

Un incident majeur peut arriver à n'importe quelle application : panne d'infrastructure, corruption de données, cyberattaque, erreur humaine. Sans plan de reprise d'activité (PRA), la durée et l'impact de l'incident sont imprévisibles. Avec un PRA testé et documenté, la reprise est organisée et les délais sont maîtrisés.

Nticstudio prépare et teste les PRAs pour les applications maintenues dans le cadre de l'offre Run.

RTO et RPO : les deux métriques fondamentales

RTO (Recovery Time Objective) : délai maximum acceptable entre l'incident et la reprise du service. Si votre RTO est de 4 heures, votre PRA doit permettre de remettre l'application en production en moins de 4 heures dans tous les scénarios couverts.

RPO (Recovery Point Objective) : perte de données maximale acceptable en cas d'incident. Un RPO de 1 heure signifie que les backups doivent être réalisés au minimum toutes les heures, car vous acceptez de perdre au maximum 1 heure de données.

Ces deux métriques définissent les exigences techniques du PRA. Un RTO de 1 heure et un RPO de 0 demandent une architecture coûteuse (réplication en temps réel, infrastructure de bascule immédiate). Un RTO de 24 heures et un RPO de 24 heures sont beaucoup plus simples et moins coûteux à atteindre.

Stratégies de backup

Les backups de base de données sont le premier élément d'un PRA. Les options par niveau de protection : snapshot quotidien (RPO = 24h, adapté aux applications sans contrainte forte), backup toutes les heures (RPO = 1h), ou réplication continue (RPO ≈ 0 mais coût élevé).

Les backups doivent être : chiffrés, stockés dans une localisation différente de l'infrastructure principale, et testés régulièrement (un backup non testé peut être inutilisable au moment critique). Le test de restauration est souvent oublié — c'est la partie la plus importante.

Scénarios couverts par le PRA

Un PRA doit couvrir les scénarios réalistes pour votre application : panne du serveur principal (bascule vers un serveur de remplacement), corruption de données (restauration depuis backup), indisponibilité de l'hébergeur (migration vers un autre hébergeur), et compromission de l'application (isolement et restauration depuis une version saine).

Chaque scénario a sa propre procédure documentée avec les étapes, les responsables, et les critères de décision (quand déclenche-t-on le PRA ?).

Tests réguliers du PRA

Un PRA non testé n'est pas un PRA — c'est un document. Les tests de PRA doivent être planifiés au moins annuellement et après chaque modification significative de l'infrastructure. Ils couvrent : le test de restauration des backups, la simulation d'une bascule d'infrastructure, et la mesure des RTO/RPO réels (souvent différents des RTO/RPO théoriques).

Les résultats des tests sont documentés et servent à améliorer le PRA. Un test qui révèle un problème est un succès : il vaut mieux découvrir la faille en test qu'en incident réel.

Questions fréquentes

Un PRA est-il obligatoire pour les applications SaaS ?

Obligatoire légalement uniquement pour certains secteurs (finance, santé). Mais contractuellement, de nombreux clients enterprise exigent un PRA avec des RTO/RPO définis avant de signer. Et pratiquement, c'est une assurance dont le coût est faible par rapport à l'impact d'un incident non préparé.

Quel est le coût d'un PRA ?

Cela dépend des RTO/RPO visés. Un PRA simple avec backup quotidien et procédures documentées représente 1 à 2 jours de travail + le coût de stockage des backups (généralement quelques euros par mois). Un PRA haute disponibilité avec RTO < 1h nécessite une infrastructure de réplication et coûte significativement plus.

Qui est responsable de l'activation du PRA ?

Le PRA définit les responsabilités : qui déclare l'incident, qui prend la décision d'activation, qui exécute les procédures. Cette chaîne de responsabilité doit être documentée et connue de toutes les parties avant l'incident.

Préparer votre plan de reprise d'activité

Décrivez votre contexte : nous revenons vers vous rapidement.

Votre besoin (optionnel)

Délai souhaité

Formulaire protégé par anti-spam. Réf. page : plan-reprise-activite · run