Che cos'è la gestione degli incidenti?

La gestione degli incidenti è una serie di misure intraprese per identificare, analizzare e risolvere gli incidenti critici che, se non ripristinati, potrebbero causare problemi all'interno dell'organizzazione.

La gestione degli incidenti ripristina il normale funzionamento dei servizi riducendo al minimo l'impatto sulle operazioni aziendali e mantenendo la qualità.

Un incidente, per definizione, è un evento che può interrompere o causare la perdita di operazioni, servizi o funzioni. La gestione degli incidenti descrive le azioni necessarie che un'organizzazione deve intraprendere per analizzare, identificare e correggere i problemi e che possano prevenire gli incidenti futuri.

Gli incidenti possono interrompere le operazioni, causare tempi di inattività temporanei e contribuire alla perdita di dati e produttività. Per le organizzazioni è sempre più importante considerare seriamente le pratiche di gestione degli incidenti, poiché offrono numerosi vantaggi.

Tra questi vantaggi vi sono:

Maggiori efficienza e produttività

Pratiche e procedure definite possono aiutare i team IT a rispondere meglio agli incidenti e a ridurre l'impatto di quelli futuri. Inoltre, l'apprendimento automatico assegna automaticamente gli incidenti ai gruppi corretti per una risoluzione più rapida. I portali dedicati alla risoluzione dei problemi consentono agli/alle agenti di accedere a tutte le informazioni necessarie da una vista unificata e di sfruttare l'intelligenza artificiale per ottenere immediatamente soluzioni consigliate. Un portale dedicato alla gestione degli incidenti principali riunisce i team e gli stakeholder giusti per risolvere i problemi e ripristinare i servizi in tempi rapidi.

Visibilità e trasparenza

Il personale può contattare in tutta facilità il supporto IT per tenere traccia dei problemi e risolverli. Il contatto con l'IT può avvenire attraverso il Web o dispositivi mobili e consente di comprendere meglio lo stato degli incidenti dall'inizio alla fine nonché i loro effetti successivi. L'esperienza dei consumatori migliora grazie alle intuitive opzioni self-service e omnicanale e alle comunicazioni bidirezionali trasparenti.

Servizio di qualità superiore

Gli/le agenti possono assegnare la priorità agli incidenti in base a processi stabiliti che contribuiscono alla continuità dei processi aziendali e vengono riuniti per gestire il lavoro e collaborare attraverso una piattaforma unificata per i processi IT. Analogamente, la gestione degli incidenti consente di ripristinare rapidamente il servizio riunendo gli/le agenti giusti per gestire il lavoro e collaborare utilizzando un'unica piattaforma per i processi IT. Il reparto IT può sfruttare l'apprendimento automatico avanzato e modelli di dati per classificare e assegnare automaticamente gli incidenti sulla base di schemi rilevati nei dati dello storico.

Più dati sulla qualità del servizio

Gli incidenti possono essere registrati nel software di gestione degli incidenti, che fornisce dati sul tempo di servizio, la gravità dell'incidente e l'eventuale presenza di una ricorrenza che può essere risolta. Da qui, il software è in grado di generare report a scopi di visibilità e analisi.

SLA (Service Level Agreement)

I sistemi di gestione degli incidenti aiutano a creare processi che forniscono dati sugli SLA e indicano se vengono rispettati.

Prevenzione degli incidenti

Una volta identificati e mitigati gli incidenti, è possibile utilizzare le informazioni su di essi e sulle risposte necessarie per risolvere più rapidamente gli incidenti futuri o prevenirli totalmente. Il tasso di deviazione degli incidenti aumenta con la diminuzione del numero di ticket e chiamate resa possibile dai portali self-service e dai chat bot di ServiceNow: il personale è in grado di trovare risposte in autonomia prima di aver bisogno di registrare un incidente, prevenendo in modo efficace i problemi prima che influiscano sugli utenti AIOps.

Miglioramento del tempo medio di risoluzione (MTTR)

Il tempo medio di risoluzione diminuisce quando sono presenti processi documentati e dati relativi a incidenti precedenti. Accelera la risoluzione degli incidenti con l'apprendimento automatico e l'assistenza contestuale per eliminare i colli di bottiglia. L'integrazione con AIOps riduce gli incidenti e il tempo medio di risoluzione (MTTR) per eliminare il rumore, stabilire le priorità e risolvere i problemi.

Riduzione o eliminazione dei tempi di inattività

Gli incidenti causano tempi di inattività, che possono rallentare le aziende o impedire loro di eseguire operazioni e servizi. I processi di gestione degli incidenti ben documentati aiutano a ridurre o eliminare completamente i tempi di inattività causati da un incidente.

Miglioramento dell'esperienza per clientela e personale

Lo svolgimento lineare delle operazioni all'interno di un'azienda si riflette in un prodotto o servizio. I clienti avranno un'esperienza migliore se le aziende non subiscono tempi di inattività o interruzioni del servizio a causa di un incidente. Allo stesso modo, l'offerta di opzioni omnicanale attraverso cui i/le dipendenti possono segnalare gli incidenti tramite portali self-service, chat bot, e-mail, telefono o dispositivi mobili consente di contattare facilmente il supporto per tenere traccia dei problemi e risolverli con la gestione degli incidenti.

Registrazione dell'incidente

L'incidente viene identificato e registrato nei report dell'utente e, attraverso l'analisi delle soluzioni, viene classificato. Questo è importante per la gestione degli incidenti futuri e la definizione delle priorità degli incidenti.

Notifica ed escalation

La tempistica di questa fase può variare da incidente a incidente, a seconda della relativa classificazione. Anche gli incidenti minori possono essere registrati e confermati senza attivare un avviso ufficiale. L'escalation avviene quando un incidente causa l'attivazione di un avviso e le procedure appropriate vengono eseguite dalla persona responsabile della sua gestione.

Grafico che mostra i diversi aspetti della gestione degli incidenti.

Classificazione degli incidenti

Gli incidenti devono essere classificati in categorie e sottocategorie per essere facilmente identificati e risolti. In genere, la classificazione avviene in modo automatico quando vengono impostati i campi corretti per la classificazione. L'assegnazione delle priorità viene effettuata in base alla classificazione e i report vengono generati rapidamente.

Assegnazione delle priorità agli incidenti

La priorità corretta può avere un impatto diretto sullo SLA di una risposta all'incidente e garantisce che i problemi business-critical vengano risolti in tempo e che né la clientela né il personale subiscano interruzioni del servizio.

Indagine e diagnosi

Quando viene segnalato un incidente, il team IT esegue un'analisi e fornisce una soluzione al personale. Se non è possibile trovare una soluzione immediatamente, l'incidente viene trasmesso ai team appropriati per ulteriori indagini e diagnosi.

Risoluzione e chiusura degli incidenti

Il team IT ha l'obiettivo di risolvere gli incidenti impiegando i metodi di assegnazione delle priorità corretti nel minor tempo possibile. La comunicazione può aiutare nella risoluzione e nella chiusura dei ticket, così come l'automazione. Una volta risolto un incidente, è possibile registrare i dati e comprendere in modo più approfondito come evitare che l'incidente si ripresenti o come ridurre il time-to-resolution.

Registrare ogni cosa

Indipendentemente dalla gravità dell'incidente, dall'urgenza o dalla posizione della persona chiamante, registra sempre tutto in un unico strumento aggiungendo il maggior numero di dettagli possibile. Tieni traccia di tutti gli incidenti per accelerare i tempi di risposta e di risoluzione. Esistono anche sistemi automatizzati in grado di riconciliare le registrazioni.

Compilare ogni campo

Compila ogni campo in modo esaustivo per garantire la presenza di dettagli per ulteriori indagini, raccolte di informazioni o report da generare.

Tenere organizzate le categorie

Evita categorie e sottocategorie non necessarie che puoi accorpare altrove o nelle descrizioni dei campi. Evita il più possibile di utilizzare opzioni come "Altro".

Tenere il team sempre aggiornato

Standardizza i processi per garantire che tutte le persone del team seguano le stesse procedure e rispondano in modo corretto a ogni incidente per mantenere una qualità costante e uniforme.

Registrare e utilizzare soluzioni standard

Le soluzioni non devono necessariamente essere nuove e innovative. In presenza di soluzioni efficaci, utilizzale per far progredire e standardizzare le procedure.

Supportare il personale

Sono molti i vantaggi organizzativi che derivano dall'offrire al personale una formazione corretta e continua, a tutti i livelli. Formare il personale che non lavora nell'IT su come rispondere agli incidenti a determinati livelli è utile per aiutare il personale IT a rispondere più rapidamente agli incidenti di livello superiore. I team che ricevono una formazione adeguata mostrano inoltre una maggiore efficacia e sinergia, oltre a comunicare meglio.

Impostare avvisi per le attività importanti

Uno degli aspetti più importanti della gestione degli incidenti è evitare il sovraccarico non necessario. Studia attentamente il modo in cui classificare gli eventi e il significato di tali categorie per evitare che gli incidenti vengano trascurati e che i tempi di risposta si allunghino troppo.

Un buon punto di partenza è definire gli indicatori del livello del servizio utilizzati per determinare la gerarchia delle priorità, ad esempio dando priorità all'analisi delle cause principali rispetto ai sintomi a livello superficiale.

Preparare il team alla reperibilità

I team devono comunicare per sapere chi supervisiona gli incidenti e quando. Crea una programmazione della reperibilità per aiutare i team a garantire che sia sempre disponibile qualcuno con le competenze appropriate in caso di incidente. Puoi apportare eventuali modifiche alla programmazione in base al carico di lavoro dei singoli elementi del personale.

Stabilire delle linee guida per la comunicazione

Crea linee guida per stabilire una comunicazione efficace: è fondamentale per la collaborazione e l'efficacia del team. Le linee guida devono stabilire i canali che il personale deve utilizzare, il contenuto di tali canali e il modo in cui documentare le comunicazioni.

Delle linee guida inadatte possono creare inutile stress e tensione durante i periodi di risposta quando non è definito uno standard su come il personale debba interagire e comunicare. Documentare correttamente le comunicazioni aiuta i team a fare riferimento alle comunicazioni precedenti a scopi di verifica e a trasmettere tutti i dettagli necessari senza perdere informazioni.

Semplificare il processo di modifica

Stabilisci i livelli o tipi di modifiche che le persone possono apportare e da chi devono ottenere l'approvazione. A seconda del sistema e della persona, potrebbe essere necessario richiedere l'approvazione o ulteriore conferma per le modifiche. Assicurati che i supervisori delle modifiche siano disponibili per garantire la rapidità e l'efficacia delle procedure di modifica.

Migliorare i sistemi attraverso le lezioni apprese

Esamina gli incidenti e valuta perché si sono verificati. Identifica le misure preventive che avrebbero potuto essere adottate per l'incidente e le misure da adottare per gli incidenti futuri. Ciò garantisce anche che tutta la documentazione sia completa e che, se necessario, sia offerta un'adeguata formazione su responsabilità e conformità.

Un problema indica una serie di incidenti per i quali non è nota la causa originaria. Un incidente indica un evento che interrompe il funzionamento ottimale di un processo. La gestione dei problemi consente di identificare la causa originaria che intacca i servizi offerti e può aiutare a evitare che i problemi si verifichino in prima istanza. La gestione degli incidenti, invece, è un approccio reattivo a qualcosa a breve termine che non funziona come dovrebbe: in presenza di un incidente i sistemi continuano a funzionare, ma la sua gestione potrebbe non necessariamente risolvere un problema, che tende ad avere un termine più lungo.

Gli incidenti sono il risultato di un mancato funzionamento (o di un problema che necessita di una risoluzione) che determina l'attivazione dei processi di gestione degli incidenti. Una richiesta riguarda invece qualcosa, ad esempio un servizio, che serve al personale: l'accesso, degli oggetti, delle attrezzature e così via.

  • Definire i processi per soddisfare i requisiti aziendali
  • Rispettare i processi e gli SLA
  • Gestire i team a diversi livelli
  • Generare report e mantenere gli indicatori chiave di prestazione (KPI)
  • Essere disponibili per l'escalation quando è necessario risolvere un incidente grave
  • Coordinarsi con gli altri team

ServiceNow Incident Management contribuisce alla produttività e alla soddisfazione del personale grazie alla facilità di contatto con il supporto per tenere traccia dei problemi e risolverli. Gli utenti possono contattare l'IT tramite un portale self-service, chat bot, e-mail, telefono o dispositivi mobili.

Anche per gli/le agenti IT si tratta di una soluzione ideale. I sistemi di apprendimento automatico assegnano automaticamente gli incidenti al gruppo di risoluzione più adatto, per una risoluzione più rapida ed efficace. I portali dedicati alla risoluzione dei problemi consentono agli/alle agenti di accedere a tutte le informazioni necessarie da una vista unificata e di sfruttare l'intelligenza artificiale per proporre soluzioni consigliate in modo istantaneo. Un portale dedicato alla gestione degli incidenti principali riunisce i team e gli stakeholder giusti per risolvere i problemi e ripristinare i servizi in tempi rapidi. Mobile Agent offre agli/alle agenti IT un'interfaccia mobile per la valutazione, la risoluzione e la chiusura degli incidenti anche in mobilità.

Inoltre, ServiceNow Incident Management offre supporto 24 ore su 24, si integra perfettamente con AIOps, consente ai/alle dipendenti di utilizzare le notifiche omnicanale per segnalare gli incidenti e offre al personale del servizio di assistenza una visione chiara sui workflow per la risoluzione degli incidenti tramite un playbook dedicato. Visual Task Boards promuove una collaborazione intuitiva ed efficace, mentre Configuration Management Database (CMDB) crea un sistema unico di registrazione per aiutare gli utenti a comprendere meglio gli impatti associati ai singoli incidenti, problemi e richieste di cambiamento.

Inoltre, grazie alla configurazione guidata, la distribuzione di ServiceNow Incident Management è un processo semplice e veloce.

Ripristina i servizi più rapidamente

Offri agli/alle agenti la possibilità di gestire il lavoro e collaborare attraverso un'unica piattaforma di processi IT.

Aumenta la produttività dei dipendenti

Dai più potere al personale grazie alle opzioni self-service omnicanale e alla comunicazione bidirezionale.

Incrementa la deviazione degli incidenti

Offri agli utenti portali self-service e chat bot intelligenti per offrire loro le risorse necessarie a risolvere i problemi senza coinvolgimento del reparto IT.

Stimola la produttività degli/delle agenti

Integra l'apprendimento automatico per garantire che gli incidenti vengano assegnati ai gruppi adeguati, per una risoluzione più rapida e completa.

Scopri di più su ServiceNow ITSM

Apri le porte all'innovazione ed elimina i silos di dati con una soluzione ITSM moderna basata su cloud.