fbpx
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
Avez-vous confiance en vos sauvegardes ? Lire la suite

Conclusion

Les besoins de continuité de service d’une entreprise se définissent selon le RTO et le RPO. La stratégie de disponibilité d’un service d’information doit être défini en fonction des 4 segments de temps suivants :

Conclusion

  • de T ­­ 0à T ­­ 1: cet intervalle de temps est compris entre l’instant où l’incident survient et celui où l’on dispose de la dernière copie de sauvegarde des données. Cet intervalle correspond donc au RPO.
  • de T ­ 1à T ­­ 2: cet intervalle de temps débute au moment où l’incident intervient et se termine lorsque le processus de recouvrement est terminé. Le déclenchement de ce processus est effectué par un opérateur ou un logiciel de contrôle. Il y a une indisponibilité de service pendant toute cette durée.
  • de T ­­ 2à T ­­ 3: cet intervalle de temps détermine le temps de fonctionnement en mode dégradé du système. Il correspond à la durée nécessaire pour pouvoir faire face à un nouvel incident conduisant à une interruption de service.
  • de T ­­ 3à T ­­ 4: cet intervalle de temps détermine la durée nécessaire pour un retour en production normal, sans dégradation de service ou de performance.

Clustering

Cette technologie a pour but d’accroître la disponibilité des applications critiques et compatibles avec celle-ci. Le principe est de disposer d’un second serveur disponible immédiatement en cas de défaillance du premier. Par un mécanisme de vérification mutuel de bon fonctionnement, le basculement sur incident automatique (« failover ») de l’application a lieu si l’un des composants logiciels ou matériels pris en charge et surveillé par le logiciel de clustering venait à défaillir. Ce mécanisme permet de réduire ou de rendre totalement invisible aux utilisateurs une défaillance majeure de l’un des deux systèmes. Le niveau de disponibilité en est donc accru considérablement. Une fois le composant remplacé et le serveur retourné en production, le basculement arrière (« failback ») peut être opéré à la demande de l’administrateur.
On distingue des solutions de clustering en mode « actif-passif » ou « actif-actif ». Dans le premier cas, l’un des deux serveurs (ou nœud) est dormant et prêt à prendre en charge l’application s’exécutant sur le nœud actif. Dans l’autre mode, les deux ou n nœuds sont actifs simultanément et se répartissent la charge applicative. Le niveau de disponibilité est supérieur à une solution « active-passive », mais le coût et la complexité de ce genre de solution en sont bien supérieurs.
Il est également possible d’implémenter des solutions de clustering étendu (« stretched cluster »). Les nœuds du cluster sont dans ce cas présents sur des sites géographiquement éloignés. Ce type de solution complexe et onéreuse est réservé à des applications nécessitant une très haute disponibilité de service.

Lire la suite... Virtualisation

Continuité de service

La continuité de service (« Business Continuity ») doit être conforme aux trois points suivants :
  • disponible à la demande et à tout instant
  • avec des performances acceptables pour répondre aux demandes dans des circonstances difficiles
  • avec des fonctionnalités acceptables pour répondre aux demandes dans des circonstances difficiles
Les technologies informatiques telles que les solutions dites à « haute disponibilité » permettent à un système de fonctionner sans interruption pendant une période de temps supérieure à celle garantie par chacun de ses composants. La haute disponibilité est donc souvent réalisée au travers d’un système à tolérance de panne.

L’architecte du système d’information doit :

  • définir ce que la disponibilité signifie dans le contexte du système d’information
  • associer les composants matériels et logiciels appropriés pour créer un système d’information hautement disponible


Dans le cadre de sa conception il doit trouver les réponses aux questions suivantes :

  • combien de temps le système doit-il être disponible ? Quel est donc son taux d’utilisation ?
  • quelles sont les conséquences si le système n’est pas disponible lorsqu’on en a besoin ?

Lire la suite... Types de panne

Degraded Operation Interval

Durée comprise entre l’instant de la panne du composant et son remplacement afin d’assurer une redondance. Une seconde défaillance analogue à la précédente durant cette période conduit donc à une interruption de service qui peut être plus longue que la précédente si une restauration devient alors impossible.

Degraded Operation Interval

Planned Downtime: période de temps devant être planifiée afin de procéder à la restauration complète suite à une panne ou un sinistre


Lire la suite... Conclusion