Identifier, analyser afin d'améliorer son processus de gestion des incidents.
Certaines normes définissent des méthodologies de suivi des incidents. Il peut être utile de s'en inspirer afin d'améliorer la stabilité de ses processus IT. La norme ISO/IEC 27035, permet par exemple de prévoir, en interne pour chaque organisme, un processus propre de gestion des incidents. D'autres méthodologies, comme ITIL, parfaitement complémentaires, définissent un incident comme tout événement ne faisant pas partie du fonctionnement normal d’un service (ou d’un équipement), et qui cause ou peut causer une son interruption ou une altération de sa qualité. En conséquence, la gestion des incidents permet de rétablir rapidement le fonctionnement normal du service et de minimiser l’impact de ceux-ci sur l’entreprise. L’action doit être menée tout en assurant le niveau de disponibilité et de service défini dans le contrat de services (SLA), à savoir le meilleur niveau possible. Il est important de retenir qu’il s’agit de traiter les conséquences et non les causes.
La gestion des incidents exige :
- Un accord de niveau de service entre le fournisseur et le client, définissant les priorités d’incidents, les trajectoires d’escalade et les délais d’intervention/résolution.
- Des modèles qui permettent de résoudre efficacement ces incidents.
- Une catégorisation des types d’incidents.
- Un accord sur les statuts et les priorités en cas d’incident.
- Une mise en place d’un processus de réponse en cas d’incident majeur.
- Un accord sur l’affectation des rôles de gestion des incidents.
Il est important de ne pas confondre la gestion des incidents » et « gestion des problèmes » car dans la terminologie ITIL la gestion des incidents est axée sur le niveau de l’utilisateur, elle sert à rétablir un service normal le plus rapidement possible, soit agir « en mode pompier ». En complément, la gestion des problèmes permet de résoudre la cause profonde des incidents dans le but d’empêcher que de futurs incidents ne se produisent. ces deux axes se complétent et se rejoignent, par exemple dans une approche ISO27001 et son suivi de l'amérioration continue.
Classification des incidents selon iTiL
- De leur priorité (faible, moyenne et élevée) : les incidents de faible priorité n’interrompent pas les utilisateurs finaux, ils peuvent généralement terminer le travail malgré l'incident.
- Les incidents de priorité moyenne sont des problèmes qui touchent les utilisateurs finaux, mais la perturbation est légère ou brève.
- Les incidents de priorité élevée affectent un grand nombre d’utilisateurs finaux et empêchent le bon fonctionnement d’un système.
On constate le volume et l’ampleur d'un incident sur une entreprise en mesurant le nombre d’utilisateurs ou le nombre de systèmes touchés par un dysfonctionnement. Lorsqu’un incident présente un impact majeur pour un grand nombre d’utilisateurs, on considère qu’il s’agit d’un incident hautement prioritaire.
- Matériel (Problème de réseaux et autres pannes du système).
- Logiciel (Bug d’application ou problème de disponibilités de service).
- Sécurité (Accès non autorisé d’un domaine ou tout autre menace qui compromet et viole les données).
Pilotage et suivi des incidents majeurs (exemple)
IMPORTANT
Au regard des obligations légales, un complément d'attributs peut être nécessaire. Ce point est abordé dans la partie Classification de maniére détaillée.