Examen Probatoire.
Dispositifs
à tolérances de panne.
Philippe NONY.
Sommaire.
Introduction 4
Présentation du problème 4
Précisions sur le sens de "tolérance de panne" 5
Haute disponibilité 5
Tolérance de panne 5
Pannes externes liées à l'environnement 6
Dispositifs 6
1 Pannes dans les systèmes informatiques. 7
Serveur et niveau de service 7
Systèmes distribués 8
Pannes 8
Pannes physiques 9
Classes de pannes. 10
Techniques de tolérance de panne 10
Sémantique de panne 10
Masquage hiérarchique 10
Redondance. 11
Redondance dans le temps 11
Redondance dans l'espace 11
Redondance spatiale passive 11
Redondance spatiale active 12
Redondance massive. 13
Equipements à tolérance de panne 14
L'architecture tandem 14
L'architecture Stratus 15
Code correcteur d'erreur 15
Le système RAID 16
Le RAID 0 16
Le RAID 1 17
Le RAID 2 17
Les RAID 3 et RAID 4 17
Le RAID 5 18
Le RAID 6 19
Le RAID 7 19
Les combinaisons de RAID. 19
Exemple de configuration RAID 01 et RAID 10 19
Le RAID 50 (0+5) 21
1.1.1 Récapitulatif : 21
Matériel ou Logiciel 22
Types de disques 23
Utilisation de disques Hot Swappables 23
Utilisation de disques Hot Spare 23
Architectures NAS et SAN 24
Architectures à Tolérance de panne 26
Cluster 26
Phase de basculement 28
Phase de rétablissement 28
Cluster et redondance 30
Les réseaux maillés (Mesh Networks) 30
Protocoles à tolérance de panne 31
Programmes distribués à tolérance de pannes 32
Conclusion 34
Bibliographie 35
Introduction Présentation du problème
Notre société dépendant de plus en plus de la technologie et de l'informatique en particulier, les besoins pour des systèmes toujours disponibles et fonctionnant de façon correcte augmentent de même. L'indisponibilité de ressources informatiques internes ou externes, qu'elle soit provoquée par des pannes réseau ou serveur, peut causer de gros préjudices. En effet, dans des domaines tels que l'informatique des salles de marchés bancaires ou de sites de commerce électronique, l'indisponibilité des ressources risque d'engendrer d'énormes pertes ou manques à gagner. L'estimation du préjudice est donc directement dépendante de l'usage fait de la communication. Plus important encore, les systèmes informatiques utilisés sur des sites comme les centrales nucléaires, les lanceurs de fusée ou le contrôle aérien doivent absolument fonctionner de manière correcte. Comment assurer que les systèmes concernés fonctionneront lorsqu'un des composants tombera en panne ? Le génie logiciel répond en partie à ces exigences en produisant des composants et des logiciels de très haute qualité. Cependant un système informatique ne se résume pas à la seul couche logicielle. Des dysfonctionnements au niveau des éléments physiques ou au niveau des couches assurant la communication sont toujours possibles. Il est impératif de considérer un système informatique dans son ensemble car chacun de ses éléments est susceptible de connaître une défaillance pouvant impacter l'ensemble du système. Nous verrons quels sont les mécanismes utilisés à différents niveaux qui permettent d'assurer le fonctionnement d'un système même en cas de panne.
|