Gestion des incidents : Pourquoi et comment gérer et suivre les incidents ?

La gestion des incidents est le processus qui consiste à gérer un ou plusieurs évènements malheureux imprévus qui interrompent un système ou un service.

Le but de cet article est de vous proposer un processus de gestion des incidents en 7 étapes pour vous aider à mieux contrôler la situation en cas de pépin.

Qu'est-ce qu'un incident ?

Un incident, tel que défini par le référentiel ITIL, est un évènement nuisible qui vient perturber le cycle de vie d’un système, service ou une organisation donnée.

Et, que ce soit dans la routine des activités d’une entreprise ou dans le cycle de vie d’un projet, un incident peut vite arriver.

Exemple :

Considérons, une entreprise de livraison, qui s’engage sur des délais avec ses clients.

Le fait que, par exemple, un camion qui soit en train d’aller livrer un client, ait brusquement une crevaison de pneu, est un incident. 

Et c’est un type d’incident qui peut être fréquent dans la routine des activités de cette entreprise.

kit du chef de projet 0923
outils du chef de projet 0923

Qu'est-ce que la gestion des incidents ?

La gestion des incidents désigne le processus par lequel on tente de gérer un ou plusieurs évènements nuisibles imprévus qui viennent perturber le cycle de vie d'un système ou d'un service.

Incident vs problème

Il ne faut pas confondre un incident et un problème.

Un incident est l’effet d’un problème. En d’autres termes, un problème est la cause d’un ou plusieurs incidents.

Aussi, le processus de gestion des incidents diffère de la gestion des problèmes.

La gestion des problèmes met un accent plus important sur la prévention, parce qu’un problème peut être dans un état latent, c’est-à-dire qu’il n’a pas encore causé d’incident.

Revenons par exemple sur le cas présenté plus haut : la panne du camion, pendant qu’il est sur un circuit de livraison.

Le problème à la base de cet incident peut être la vétusté des pneus ou l’insuffisance du mécanisme de contrôle avant les départs de camions.

Dans l’exemple ci-dessus, gérer le problème, permet de mieux prévenir une crevaison de pneu.

Alors que réparer une crevaison, c’est résoudre un incident.

Pourquoi est-il important de gérer les incidents ?

La gestion d'incident est un élément important dans l’organisation d’une structure ou même d’un projet.

C’est pourquoi, pour mieux la maîtriser, il est recommandé de définir un plan ou un processus de gestion d'incidents.

Cette procédure a pour objectifs de :

  • Bâtir une démarche cohérente pour faire face à tout type d’incident 
  • Résoudre rapidement et efficacement les incidents 
  • Gérer la communication et l’engagement des parties prenantes pendant la crise liée à l’incident 
  • Avoir des statistiques fiables sur les incidents récurrents 
  • Avoir une base de connaissances sur les traitements appliqués aux incidents

Les 7 étapes de la gestion des incidents

J’ai identifié 7 étapes clés à prendre en compte dans la définition d’un bon processus de gestion des incidents.

Chacune de ces étapes sera décrite dans les sections ci-après :

1) Identifier l’incident

La première étape, c’est la déclaration de l’incident.

Il s’agit là de savoir qu’il y a un incident, et le prendre en charge, pour traitement.

Il est conseillé d’élaborer une fiche de déclaration d’incident qui sera mise à disposition des usagers.

Cette fiche peut être reproduite dans un outil de gestion d'incidents, pour plus d’automatisation.

2) Définir et classifier un incident

Après avoir été notifié de l’incident, il faut maintenant le qualifier.

Il s’agit ici de classifier l’incident selon un ordre de priorité. 

La priorité peut être définie sur le niveau d’impact de l’incident, la population concernée, les effets cascades, etc.

Imaginons un incident de panne d’électricité dans une usine : c’est toute la production qui s’arrête, les ventes seront par conséquent impactées, etc.

Un tel incident, ne sera pas classifié au même niveau de priorité avec un incident lié à l’imprimante de l’agent comptable qui a une panne.

C’est pourquoi, il existe généralement trois niveaux de priorité classiques pour les incidents :

  • « Haute »
  • « Normale »
  • « Basse »

L’organisation devra définir les types d’incidents par priorité. 

Par exemple, on peut considérer que les incidents de priorité « Haute » sont ceux qui provoquent un arrêt total de la productivité, et ainsi de suite. 

objectifs gestion des incidents

3) Recueillir les preuves et enquêter

Relever les preuves et les faits, est une marche importante sur l’escalier qui mène à la résolution de l’incident.

L’idée, c'est de collecter tous les points d’impacts de l’incident.

Cette étape aide également à circonscrire l’incident et limiter les conséquences.

4) Analyser les causes

Il s’agit de remonter à la racine de l’incident pour identifier les causes exactes et profondes.

Un incident dont la vraie cause n’a pas été identifiée, peut être mal résolue.

Et l’incident peut ressurgir à nouveau après peu de temps.

Prenons un exemple :

Supposons un incident qui consiste en l’arrêt du système de froid sur un dispositif de climatisation.

Un premier niveau de diagnostic peut relever qu’il n’y a plus de gaz dans le circuit.

Mais si, on s’arrête juste à cette analyse sans comprendre ce qui a provoqué l’insuffisance du gaz, on peut compléter le niveau de gaz, en pensant résoudre l’incident.

Cependant, derrière cet incident, la véritable cause pourrait être la perforation d’un tuyau, qui provoque une fuite de gaz.

Si on résout seulement l’incident, en ne remettant que le gaz, le même incident se reproduira, de façon imminente.

5) Résoudre l'incident

C’est l’étape de la résolution effective de l’incident.

Cela consiste à appliquer le traitement adéquat pour éliminer l’incident.

Il peut arriver que cette étape fasse l’objet de plusieurs escalades entre intervenants pour aboutir à la solution définitive.

Le processus de gestion des incidents doit prendre en compte tous les niveaux d’escalade éventuels.

processus de gestion des incidents

6) Vérifier la résolution

Le traitement appliqué pour résoudre l’incident doit être testé.

Ce n’est pas une étape toujours requise, mais fortement recommandée. 

Elle permet de s’assurer que c’est bien le bon traitement qui a été appliqué.

7) Clôturer l’incident et enrichir votre base de connaissances

Une fois la vérification de la résolution effectuée, il faut marquer l’incident comme étant clos.

C’est l’étape finale. 

Suite à cela, la base de connaissances de l’organisation doit être enrichie avec les données suivantes :

  • le problème à la source de l’incident
  • les impacts négatifs de l’incident
  • les traitements appliqués pour résoudre l’incident
  • les personnes et/ou leur profil, ayant travaillé à la résolution de l’incident
  • le délai de résolution en précisant :
    • le temps écoulé entre la déclaration de l’incident et sa prise en charge
    • le temps mis entre la prise en charge et la résolution
    • le temps effectué entre la résolution et la clôture

Ces données pourraient constituer un bon rapport de gestion d'incidents.

En effet, toute clôture d’incident doit être soldée par un rapport.

le kit du chef de projet 0923
outils du chef de projet 0923

Gérer l’engagement des parties prenantes pendant l’incident

Il est important d’identifier les parties prenantes concernées et de gérer leur engagement tout le long de la procédure de gestion de l’incident.

Les acteurs clés impactants et impactés par l’incident doivent être continuellement informés de toutes les actions menées dans la gestion de la crise.

La politique de gestion des incidents doit inclure un plan de communication qui devrait contenir à minima :

Modèle de Plan de Communication Projet

Avec une étude de cas concrète

modèle de plan de communication

Quels sont les statuts d’un incident ?

Pendant ces étapes, l’incident doit passer par plusieurs statuts, et cela doit être clair pour chaque partie prenante concernée.

1) Statuts de base

Les différents statuts ou états d’un incident dans son cycle de vie sont :

  • Incident déclaré
  • Incident pris en charge
  • Incident en cours de résolution
  • Incident résolu
  • Incident clos

Voyons ci-après la signification de chacun de ces statuts pour chacune des étapes de gestion des incidents sus-mentionnées :

Statut de l’incident

Description

Étapes de gestion de l'incident

Déclaré

L’incident est identifié et a fait l’objet de notification

Étape 1 : Identifier l’incident

Pris en charge

Les acteurs en charge de la résolution de l’incident ont démarré leurs investigations

Étape 2 : Définir l’incident

En cours de résolution

La résolution de l’incident est initiée et la recherche de solution est en cours

Étape 3 : Recueillir les preuves et enquêter
Étape 4 : Analyser les causes
Étape 5 : Résoudre l’incident

Résolu

La solution est trouvée et appliquée. L’incident est résolu

Étape 6 : Vérifier la résolution

Clos

La solution est testée et on est sûr que c’est la bonne. Tout est OK. L’incident est maintenant clos

Étape 7 : Clôturer l’incident et enrichir votre base de connaissances

statuts de gestion d'incident

Il existe des outils de gestion des incidents qui permettent de suivre, de façon plus dynamique, chacun de ces statuts.

2) Statuts intermédiaires

De plus, il faut comprendre que selon le contexte, il peut exister des statuts intermédiaires qui sont présentés comme suit : 

  • En attente : L’incident est pris en compte, mais sa résolution est retardée par des facteurs externes.
    Toutefois, dans un tel cas, l’hémorragie éventuellement provoquée par l’incident devrait d’abord être maitrisée, pour en limiter les dégâts.
    Par exemple : Mettre le processus de résolution d’un incident en attente, peut s’avérer nécessaire quand on a un SLA serré à respecter. La mise en attente, met le chronomètre en pause.
  • Traitement temporaire ou Solution non éprouvée : Il peut arriver qu’on ne sache pas exactement la bonne solution à l’incident. Dans ce cas, on essaie des solutions intermédiaires, quitte à fournir un service dégradé aux usagers.

Statut de l’incident

Description

En attente

L’incident est pris en compte, mais sa résolution est retardée par des facteurs externes.
Toutefois, dans un tel cas, l’hémorragie éventuellement provoquée par l’incident devrait d’abord être maitrisée, pour en limiter les dégâts.
Par exemple :
Mettre le processus de résolution d’un incident en attente, peut s’avérer nécessaire quand on a un SLA serré à respecter. La mise en attente, met le chronomètre en pause.

Traitement temporaire ou Solution non éprouvée

Il peut arriver qu’on ne sache pas exactement la bonne solution à l’incident.

Dans ce cas, on essaie des solutions intermédiaires, quitte à fournir un service dégradé aux usagers.

Conclusion

La gestion des incidents est une compétence importante de management, et encore plus quand il s’agit de mener un projet à son terme, en qualité de chef de projet.

Le but de cet article a été de vous aider à adopter une bonne méthode de gestion du cycle de vie des incidents.

N'hésitez pas à partager vos avis et questions dans les commentaires ci-dessous.

Guillaume Sigui

A propos de l'auteur

Guillaume SIGUI est ingénieur de conception en informatique de formation. Après plusieurs postes occupés dans la direction et la gestion de projet, il veut partager ses expériences avec vous dans la conduite de projet, et vous aider à faire face aux exigences de ce métier passionnant.

Les autres articles du dossier 

{"email":"Adresse email invalide","url":"Url du site invalide","required":"Champ obligatoire non renseigné"}

Guide GRATUIT du chef de projet

25 points clés que la plupart des chefs de projet négligent dans la gestion de leurs projets (+ concepts et notions clés).

>