Che cos'è l'osservabilità?

L'osservabilità è la capacità basata su software di spiegare qualsiasi stato di un sistema, in base ai suoi output esterni.

Spesso, la complessità di un sistema dipende dalla sua potenza e capacità. Purtroppo, con questa maggiore complessità si aumenta l'imprevedibilità; si verificano errori, colli di bottiglia delle prestazioni, bug, ecc. Inoltre, determinare la causa all'origine di questi eventi non è sempre semplice. Nei sistemi moderni complessi, oltre alla probabilità di guasti imprevisti, aumenta anche il numero di possibili modalità di guasto. Per contrastare questa tendenza, i team IT, di sviluppo e operativi hanno iniziato a implementare strumenti di monitoraggio in grado di vedere i sistemi stessi.

Tuttavia, il progresso avanza e la complessità dei sistemi di oggi supera le funzionalità di monitoraggio tradizionali. Oggi, la strategia comprovata per la protezione dei sistemi da guasti di cui non siamo a conoscenza non è monitorare ma rendere il sistema monitorabile e osservabile.

La distinzione tra osservabilità e monitoraggio è una distinzione delicata ma importante. Rivedere le capacità e gli obiettivi di ogni membro del team può aiutare a comprendere meglio questa distinzione e a sfruttare al meglio le proprie strategie di osservabilità.

Il monitoraggio consente agli/alle utenti di guardare e interpretare lo stato di un sistema utilizzando una serie predefinita di parametri e registri. In altre parole, consente di rilevare set noti di modalità di guasto. Il monitoraggio è fondamentale per analizzare le tendenze, creare dashboard e avvisare i team di risposta dei problemi non appena si verificano. Fornisce informazioni sul funzionamento delle applicazioni, sulla loro crescita e sul loro utilizzo. Tuttavia, il monitoraggio dipende da una chiara comprensione delle possibili modalità di guasto. In altre parole, può aiutare a identificare le "cose che sappiamo di non sapere" (rischi già noti), ma non aiuta a gestire le "cose che non sappiamo di non sapere" (rischi completamente imprevisti, non considerati e quindi impossibili da monitorare).

Questo è problematico, perché nella maggior parte dei sistemi complessi, le cose che non sappiamo di non sapere superano notevolmente quelle che sappiamo di non sapere. Per quest'ultime, è relativamente più facile prepararsi. A ciò si aggiunge lo scoraggiamento dato dal fatto che la maggior parte di queste cose che non sappiamo di non sapere, note anche come punti ciechi, si concretizzano così di rado che identificare e pianificare ciascuna di esse sarebbe un enorme spreco di energie. Ciò che le rende una minaccia per le aziende è il loro volume. Pertanto, poiché non è possibile prevedere quali siano questi problemi o monitorarli, è necessario raccogliere costantemente quanto più contesto possibile dal sistema stesso. L'osservabilità fornisce questo contesto e permette di evitare i controlli dello stato, scavando invece a fondo nel funzionamento del software stesso. Misura la tua comprensione dello stato interno di un sistema in base ai suoi output esterni, utilizzando strumenti che ti aiutano a ottenere dati approfonditi e a eseguire il monitoraggio.

Il monitoraggio è ciò che accade quando qualcosa diventa osservabile. Senza osservabilità, non è possibile monitorare.

Il software sta diventando di giorno in giorno più complesso. Esiste una combinazione di modelli nell'infrastruttura, come i microservizi, la polyglot persistence e i container che scompongono i container più grandi in sistemi più piccoli e complessi.

Allo stesso tempo, la quantità di prodotti è in crescita ed esistono molte piattaforme e modi che offrono alle organizzazioni possibilità nuove e innovative. Anche gli ambienti sono sempre più complessi. Tuttavia, non tutte le organizzazioni stanno affrontando il crescente numero di problemi che si verificano. In un sistema che manca di osservabilità, la causa dei problemi resta sconosciuta e non c'è un punto di partenza standard.

Affidabilità

L'obiettivo principale dell'osservabilità è l'affidabilità. Un'infrastruttura IT efficace che funzioni correttamente e in modo affidabile in base alle esigenze dei clienti richiede una misurazione delle sue prestazioni. Gli strumenti di osservabilità permettono di conoscere il comportamento degli/delle utenti, la disponibilità del sistema, la capacità e la velocità della rete per garantire che tutto funzioni in modo ottimale.

Sicurezza e conformità

Le organizzazioni che devono rispettare determinati standard di conformità devono avere ambienti informatici osservabili. La visibilità completa resa possibile dall'osservabilità attraverso i registri eventi consente alle organizzazioni di rilevare potenziali intrusioni, minacce alla sicurezza, tentativi di violazione con metodo forza bruta o possibili attacchi DDoS.

Crescita dei ricavi

La capacità di analizzare gli eventi fornisce informazioni preziose sui comportamenti e su come questi sono influenzati da variabili quali il formato delle applicazioni, la velocità e così via. Tutti questi dati possono essere analizzati per ottenere informazioni utili per l'ottimizzazione della rete e delle applicazioni al fine di generare ricavi e attirare nuovi clienti.

L'osservabilità è suddivisa in tre pilastri: registri, parametri e tracce.

Registri

Questo è il record di un evento che si è verificato su un sistema. I registri vengono generati automaticamente, presentano l'indicatore data e ora e vengono scritti in un file che non può essere modificato. Offrono una registrazione completa degli eventi, inclusi i metadati relativi allo stato di un sistema e al momento in cui si è verificato l'evento. Possono essere scritti in testo non crittografato o strutturati in un formato specifico.

Parametri

I parametri sono rappresentazioni numeriche dei dati misurati nel tempo. Mentre i registri eventi raccolgono informazioni su eventi specifici, i parametri sono valori misurati derivati dalle prestazioni complessive del sistema. Di solito forniscono informazioni sugli SLI delle applicazioni.

Tracce

Le tracce sono record di eventi correlati causalmente che si verificano in una rete. Gli eventi non devono verificarsi all'interno di una singola applicazione, ma devono far parte dello stesso flusso di richieste. La traccia può essere formattata come un elenco di registri eventi raccolti da sistemi separati coinvolti nell'adempimento della richiesta.

I tre pilastri dell'osservabilità aiutano a mettere insieme fonti di dati da cui sarebbe altrimenti difficile trarre conclusioni singolarmente. Questo perché, nella sua essenza, l'osservabilità dipende da due cose:

  • Dati di telemetria ad alto contesto con molto contesto di runtime.
  • La capacità di interagire con questi dati in modo iterativo per ottenere nuove informazioni senza distribuire codice.

Quando ci sono questi due fattori, le aziende dispongono delle risorse di cui hanno bisogno per migliorare l'osservabilità dei sistemi e delle applicazioni.

L'osservabilità è efficace solo nella misura in cui è attuabile; anche se i team avessero tutti i dati di telemetria contestualizzati del mondo, non potrebbero ottenere l'osservabilità se non disponessero delle risorse per renderli attuabili.

Contesto e topologia

Contesto e topologia si riferiscono a strumenti che consentono di comprendere le relazioni in un ambiente multi-cloud dinamico con molti componenti interconnessi. I metadati contestuali rendono possibili mappe topologiche in tempo reale e favoriscono la comprensione delle dipendenze causali attraverso lo stack, nonché tra servizi, processi e host.

Automazione continua

Il reparto IT non si preoccupa più della configurazione manuale, ma concentra i suoi sforzi sul rilevamento automatico, sulla strumentazione e sulla definizione delle basi di ogni componente del sistema. L'automazione continua aggiunge progetti di innovazione che danno priorità alla comprensione di ciò che conta. L'osservabilità è scalabile, consentendo così a team limitati di fare di più con meno risorse.

Assistenza AI

Un'analisi alberi di guasto, congiuntamente alla visibilità a livello di codice, consente di identificare la causa originaria delle anomalie senza affidarsi a tentativi ed errori, congetture o correlazioni. L'intelligenza artificiale basata sui rapporti di causalità rileva anche attività insolite per scoprire ciò che non è noto.

Ecosistema aperto

Sarebbe bene estendere l'osservabilità in modo che includa fonti di dati esterne. Questo può consentire la mappatura topologica, l'individuazione automatica, la strumentazione automatizzata e le risposte operative necessarie per l'osservabilità su vasta scala.

Funzionalità che crescono con il tuo business

Prevedi i problemi prima che si verifichino con ServiceNow.