Quando si tratta di Business Continuity e di Disaster Recovery, sappiamo tutti che i dati per monitorare le condizioni, sono fondamentali. 

La creazione di report sulle metriche è uno dei pochi modi per sapere veramente che ciò che stai facendo funziona, ma per molti responsabili della continuità aziendale e del ripristino di emergenza, questa è una sfida enorme. 

Se non disponiamo di uno strumento automatizzato, è probabile che ci dobbiamo affidare a Word, Excel e ai colleghi di altri reparti per raccogliere le metriche BC/DR. 

Cosa deve fare un manager BC/DR? 

Sapete già che BC/DR è una componente fondamentale del successo di un’organizzazione. E sappiamo che c’è bisogno di metriche per misurare l’efficacia degli sforzi fatti. Il primo passo è comprendere le metriche che contano nella pianificazione della continuità aziendale e del ripristino di emergenza, che è esattamente ciò che tratterà questo articolo. Avrai anche bisogno di uno strumento per raccogliere e riferire su queste metriche. A seconda delle dimensioni della tua organizzazione e del livello di maturità del tuo programma BC/DR, questo potrebbe variare da un modello Excel a un potente software automatizzato.

Metriche BC/DR importanti

Ci sono 7 importanti metriche BC/DR da monitorare per crescere e misurare i piani di ripristino:

  1. Obiettivi del tempo di recupero (RTO)
  2. Obiettivi del punto di ripristino (RPO)
  3. Il numero di piani che coprono ogni processo aziendale critico
  4. La quantità di tempo dall’aggiornamento di ogni piano
  5. Il numero di processi aziendali minacciati da un potenziale disastro
  6. Il tempo effettivo necessario per ripristinare un processo aziendale
  7. La differenza tra il tuo obiettivo e il tempo di recupero effettivo

Sebbene ci siano molte altre metriche da monitorare, queste metriche servono come revisione di base del programma e indicano quanto si è veramente preparati per affrontare un problema bloccante.

Metriche critiche in BC/DR

Le prime due importanti metriche BC/DR sono gli obiettivi del tempo di ripristino (RTO) e gli obiettivi del punto di ripristino (RPO). L’RTO è il periodo di tempo massimo accettabile in cui l’articolo può rimanere inattivo. Gli RPO determinano l’età dei dati che puoi permetterti di perdere e se i tuoi backup salveranno il resto. Ad esempio, se puoi permetterti di perdere un’ora di dati, dovrai eseguire i backup almeno ogni ora.

Le procedure di backup e ripristino sono al centro di un buon piano BC/DR, quindi è necessario considerare sia gli RTO che gli RPO per determinare i migliori strumenti di backup e ripristino per il lavoro. Se, ad esempio, generi transazioni continue con un volume e un valore da moderati ad alti, quanti minuti di transazioni potresti permetterti di perdere? Per quanto tempo potresti permetterti di essere fuori servizio? Un’applicazione di questo tipo potrebbe trarre vantaggio dai backup molto frequenti a livello di blocco possibili con la protezione continua dei dati (CDP), ma non lo sapresti se non esaminassi sia gli RTO che gli RPO.

Infine, è necessario misurare il numero di piani che coprono ciascun processo aziendale , nonché il tempo trascorso dall’aggiornamento di ciascun piano . Gli indicatori chiave di prestazione (KPI) sono una misura di quanto bene funziona un programma e uno che non puoi ignorare. Puoi impostare KPI per quanto spesso rivedi e aggiorni i tuoi piani (ad esempio, ogni mese, 6 mesi o anno) e quante funzioni aziendali sono coperte da un piano di ripristino, con un piano d’azione per raggiungere una copertura del 100%. Se hai poco tempo e risorse, inizia con i tuoi processi aziendali più critici.

Metriche per la pianificazione

Le aziende possono avere da centinaia a migliaia di processi e non è possibile ripristinare un processo senza un piano. Una metrica chiave per la pianificazione BC/DR è il numero di processi minacciati da un potenziale disastro .

Dovresti iniziare con un’analisi dei rischi e un’analisi dell’impatto aziendale per:

  • comprendere i maggiori rischi che minacciano la tua organizzazione e,
  • l’impatto di tali rischi su varie funzioni dell’azienda. 

Quindi, puoi creare piani per proteggere questi processi e ridurre al minimo l’interruzione in caso di disastro.

Ma i piani statici possono ristagnare. Non è possibile ripristinare i processi a meno che non si aggiornino periodicamente i piani per tenere conto dei cambiamenti nelle applicazioni, nei dati, negli ambienti, nei dipendenti e nei rischi. Dovresti impostare promemoria per te stesso per sollecitare le revisioni del piano nei punti appropriati del ciclo. In un mondo perfetto, riceveresti conferma dai responsabili dei vari dipartimenti che hanno rivisto e aggiornato i loro piani, ma siamo sinceri: rivedere e aggiornare quei piani è un’enorme seccatura ed è quasi miracoloso se lo fanno in tempo. L’uso del software può alleviare questo punto dolente: puoi automatizzare i promemoria via e-mail ai vari proprietari del piano e tenere traccia dei loro progressi all’interno del software: non sono necessarie e-mail passive aggressive! Il software rimuove anche molte delle attività noiose relative alla gestione del cambiamento. Per esempio, le integrazioni automatizzate dei dati manterranno i tuoi dati aggiornati automaticamente man mano che i dati cambiano in altre applicazioni. Se un singolo contatto viene utilizzato in 100 piani e il suo numero di telefono cambia, un sistema integrato trasferirà tale modifica anche ai tuoi piani di continuità aziendale e di gestione delle emergenze.

Utilizzo di metriche per misurare l’efficacia del piano e del ripristino

Uno dei modi più semplici per determinare in che modo le funzioni aziendali sono interdipendenti consiste nell’utilizzare uno strumento di modellazione delle dipendenze. Questo ti aiuterà a visualizzare se le dipendenze dell’applicazione ti consentono di soddisfare RTO e SLA.

Articoli correlati
Newsletter sull’Innovazione
Non perderti le notizie più importanti sull'Innovazione. Iscriviti per riceverle via e-mail.

Ad esempio, se è necessario recuperare un servizio di contabilità fornitori in 12 ore, ma ciò dipende da un software finanziario che può richiedere fino a 24 ore per il recupero, la contabilità fornitori non può soddisfare uno SLA di 12 ore. Un modellatore di dipendenze illustra queste relazioni dipendenti in modo dinamico e quando e come un piano si interromperà di conseguenza.

Dovresti misurare il tempo effettivo necessario per ripristinare un processo aziendale . Puoi testare le procedure di ripristino utilizzando uno strumento BC/DR per tenere traccia del tempo impiegato da ogni passaggio.

In alternativa, puoi utilizzare il metodo della vecchia scuola cronometrando ogni passaggio manualmente. Questi test ti aiuteranno a determinare se le tue persone e i tuoi processi possono soddisfare gli RTO utilizzando il tuo piano esistente. Dovresti essere in grado di completare le attività di ripristino nel tempo consentito dal piano e, se non puoi, devi rivedere il tuo piano in modo che sia realistico e realizzabile.

Infine, l’ultima metrica trattata in questa risorsa è la differenza tra il tempo di recupero effettivo e quello previsto , nota anche come analisi del divario. E’ possibile testare le lacune con, test di failover e ripristino, test BC/DR a livello aziendale e analisi delle lacune. Una volta individuate le lacune nei piani, puoi impostare i KPI e utilizzarli nel processo di pianificazione.

Best practice per pulire i dati BC/DR

I dati raccolti dal software BC/DR devono essere “puliti” per garantire report e pianificazione accurati. Per una buona igiene dei dati, assicurati di standardizzare l’immissione dei dati con menu a discesa, elenchi di selezione, formattazione del testo e convalida dei dati. Ad esempio, se inseriamo i numeri di telefono dei dipendenti in un piano, consigliamo di verificare se tali numeri di telefono includono un prefisso e rimangono in uso.

La de-duplicazione e la gestione di identità e accessi (IAM) possono aiutare a produrre dati eleganti. È possibile utilizzare la de-duplicazione per eliminare più aspetti delle stesse voci. È possibile utilizzare le credenziali (autenticazione) insieme alle autorizzazioni (autorizzazione) per garantire che solo gli utenti qualificati inseriscano record e dati anagrafici. Potrai anche risparmiare un sacco di tempo e grattacapi integrando il tuo sistema BC/DR con altre applicazioni (ad esempio, il tuo sistema HR) per evitare la duplicazione dei record e ogni possibilità di errori.

Dove iniziare

Determinare le funzioni aziendali critiche e il modo in cui dipendono l’una dall’altra utilizzando uno strumento di modellazione delle relazioni.

Successivamente, impostiamo una soglia di tempo di inattività accettabile utilizzando le metriche RTO e RPO. Mettiamo alla prova i piani per vedere se ci avviciniamo o superiamo tali soglie. Dopo averlo fatto, rivediamo i piani e testiamoli di nuovo. Dovremmo impostare KPI per misurare la frequenza con cui i piani vengono aggiornati e testati e condurre un’analisi del divario per confrontare il tempo di ripristino pianificato rispetto a quello effettivo.

Infine, assicuriamoci di mantenere dati “igienici” per rapporti accurati. Le metriche BC/DR sono completamente inutili se i dati non sono accurati. Può sembrare un gioco da ragazzi, ma è sorprendente quante aziende si cullano in un falso senso di sicurezza con rapporti che travisano i loro SLA. È sempre meglio essere realisti, anche se questo significa accettare i rischi che ne derivano.

Ercole Palmeri

Newsletter sull’Innovazione
Non perderti le notizie più importanti sull'Innovazione. Iscriviti per riceverle via e-mail.