Point individuel de défaillance
Un point unique de défaillance (single point of failure ou SPOF en anglais) est un point d'un système informatique dont le reste du système est dépendant et dont une panne entraîne l'arrêt complet du système.
Le point unique de défaillance a comme principale caractéristique de ne pas être protégé (redondant). Il est donc un risque pour la disponibilité du système. Dans la définition « single point of failure », le mot anglais single souligne le caractère unique et donc fragile du « composant ».
La notion de point unique de défaillance est fortement liée à celle de service, dans la mesure où un problème sur le point concerné entraîne une interruption de service.
La présence d'un point unique de défaillance dans un système augmentant la probabilité d'apparition d'un déni de service, elle entraîne un risque sur la qualité de service.
Dans un cadre de haute disponibilité, il est impossible de laisser des points individuels de défaillance dans un système.
Sommaire
1 Exemples
1.1 Architecture physique
1.2 Architecture logicielle
2 Détection
3 Élimination
4 Articles connexes
Exemples |
Architecture physique |
Potentiellement, tous les éléments d'une architecture physique peuvent devenir des points individuels de défaillance. Les éléments principaux sont :
- Proxy
Pare-feu (firewall)- Routeur
- Opérateur réseau
- Serveur de répartition de charge
- Serveur de service (HTTP, LDAP, Base de données, stockage, etc.)
- Tout câble ou interface réseau
- L'alimentation électrique (transformateur qui casse, arrivée d'alimentation qui disjoncte, câble sectionné).
Selon les conditions où se situe l'hébergement de services à distance, on peut également l'appliquer au centre de données où est hébergé l'architecture :
- Catastrophe naturelle (risque sismique, d’inondation, de fontis (effondrement de sols (à Paris par exemple, en raison des nombreuses carrières).
- Catastrophe industrielle (catastrophe nucléaire et zone d'exclusion nucléaire associée, explosion d'une usine pétrochimique)...
- Risque d'un bombardement, lors d'une guerre.
- Risque d'un incendie (les centres sont généralement équipés de protection contre les incendies).
Architecture logicielle |
Il en va de même pour nombre d'éléments de l'architecture logicielle, dans le cadre d'une Architecture Orientée Service (SOA). Parmi les éléments les plus sensibles, et par conséquent les plus sujets à attaques, on doit citer :
- Les services de localisation de ressources logicielles comme DNS.
- Les services d'annuaire, bases de l'authentification de l'utilisateur d'une application. Par exemple, LDAP ou Microsoft Active Directory.
- Les systèmes de gestion de bases de données.
Le risque engendré par la défaillance d'un de ces éléments doit être réduit par l'application du principe de redondance.
Détection |
Les points individuels de défaillance sont fortement liés à la notion de service. Un SPOF peut donc ne pas être détecté du point de vue d'un service défini (comme le fonctionnement d'un intranet), mais être évident du point de vue d'un autre service (comme un service d'hébergement de sites web).
Il est par conséquent nécessaire de faire une cartographie détaillée et exhaustive d'un système pour pouvoir détecter les points individuels de défaillance.
Élimination |
La principale technique d'élimination d'un point individuel de défaillance, quel que soit le système dont il fait partie, consiste à ajouter une redondance du point de défaillance.
Articles connexes |
Shortest Path Bridging, (IEEE 802.1aq)- Goulot d'étranglement
- ITIL
- Portail de la sécurité informatique