Casa Recensioni Revisione e valutazione Pagerduty

Revisione e valutazione Pagerduty

Video: Take the Lead Jenn Tejada & Stacey Cunningham (Ottobre 2024)

Video: Take the Lead Jenn Tejada & Stacey Cunningham (Ottobre 2024)
Anonim

PagerDuty è un servizio di risposta all'incidenza e di allerta che funziona praticamente con qualsiasi servizio di monitoraggio. Il servizio può essere configurato per inviare avvisi tramite telefonata, e-mail, SMS o tramite app iOS e Android, completo di conferma della consegna e reinstradamento automatico. Una dashboard mostra gli incidenti e lo stato di avviso in tutti gli strumenti di monitoraggio. Pianificazioni sofisticate e configurazioni di escalation degli avvisi mantengono tutto il team al passo. L'analisi avanzata di PagerDuty aiuta a identificare gli hotspot e le tendenze delle prestazioni del team.

Sono stato coinvolto in soluzioni di risposta all'incidenza per oltre 20 anni e posso tranquillamente affermare che PagerDuty raggiunge un grande equilibrio tra facilità d'uso e potenza. Lo ammetto, sono innamorato di PagerDuty.

Installazione

La registrazione è stata molto semplice e ha semplicemente richiesto il mio indirizzo e-mail e una password. Mi è stato quindi richiesto di inviare un avviso di prova tramite SMS, telefono ed e-mail. Entro 10 secondi ho ricevuto tutti e tre gli avvisi. L'avviso SMS PagerDuty mi ha spinto a scaricare un'app mobile, mentre la telefonata diceva "ciao questo è un avviso di test PagerDuty. Aggiungi questo numero al tuo telefono per assicurarti di ricevere sempre i tuoi avvisi". È stato rassicurante che il sistema di allarme funzionasse.

Il passo successivo è stato quello di collegare il mio strumento di monitoraggio. Questo potrebbe essere fatto semplicemente selezionando il mio strumento preferito da una casella a discesa dei programmi supportati tra cui HP SiteScope, New Relic APM, CopperEgg o uno dei 50 o più che erano elencati. Ho scelto CopperEgg perché avevo già impostato un account per riesaminare il servizio. Avrei anche potuto scegliere di inviare e-mail a PagerDuty per attivare avvisi o connettersi direttamente all'API REST di PagerDuty. Quando ho fatto clic per aggiungere CopperEgg, sono stato indirizzato a una pagina Web con ulteriori informazioni sull'integrazione. Successivamente, dovevo generare e aggiungere una chiave API PagerDuty a CopperEgg. Ho quindi impostato l'escalation degli incidenti in modo che se non avessi risposto dal primo avviso entro 10 minuti e il risponditore secondario sarebbe stato inviato per e-mail.

Lavorare con PagerDuty

Accedendo a PagerDuty, sono rimasto colpito da quanto fosse semplice l'interfaccia. L'interfaccia di PagerDuty offre tutte le opzioni di navigazione nella parte superiore della pagina: dashboard, incidenti, configurazione, analisi e guida. La dashboard si apre per impostazione predefinita e include un elenco dei miei incidenti aperti e degli incidenti aperti a livello aziendale, oltre a tutte le attività sugli incidenti degli ultimi sette giorni. La schermata degli incidenti è molto simile alla dashboard ma include più opzioni per lavorare con gli incidenti.

La vera carne di PagerDuty risiede nel menu di configurazione, che include opzioni per programmi, servizi, politiche di escalation, utenti e team. Il primo passo per lavorare con PagerDuty è creare utenti che saranno avvisati quando si verificano incidenti. Gli utenti sono assegnati a uno dei quattro ruoli che vanno dal limitato, un utente che può solo innescare, riconoscere e risolvere gli incidenti, a un proprietario dell'account che ha la capacità di gestire qualsiasi cosa nel sistema PagerDuty. A ciascun utente vengono assegnate regole di notifica; possono essere avvisati di incidenti nuovi o modificati e quando il loro periodo di guardia inizia via e-mail, telefonata o SMS. È molto probabile che le grandi organizzazioni vorranno assegnare gli utenti ai team in modo che le pianificazioni, le notifiche e le politiche di escalation possano essere gestite più facilmente. Ad esempio, un'organizzazione potrebbe avere un team che viene avvisato per incidenti del server e un altro team che viene avvisato per incidenti di sicurezza.

In PagerDuty, come con qualsiasi sistema di risposta all'incidenza, il diavolo è nei dettagli. Il concetto generale è quello di avvisare coloro che hanno bisogno di sapere al momento giusto e quindi creare backup in modo che nulla cada nelle crepe. Per fare ciò è necessario prestare particolare attenzione alle pianificazioni e alle politiche di notifica, in particolare alle politiche di escalation. PagerDuty fa un lavoro fantastico nel rendere i dettagli facili da configurare e gestire e questo è principalmente a causa di una GUI potente ma di facile comprensione. L'impostazione di una pianificazione su chiamata richiedeva poco più che selezionare gli utenti, scegliere un tipo di rotazione (giornaliera, settimanale o personalizzata) e scegliere un'ora e una data di inizio. Le pianificazioni su chiamata possono essere sovrapposte l'una sull'altra in modo da poter vedere dove si sovrappongono e sulla pagina di gestione delle programmazioni viene visualizzato un calendario che mostra chiaramente le pianificazioni e le sovrapposizioni su chiamata. La politica di escalation è anche molto facile da configurare e gestire grazie a una semplice GUI.

Il mio primo test di PagerDuty riguardava l'apertura manuale di un incidente, che è tra l'altro una grande funzionalità per testare come sono configurate le notifiche e le politiche di escalation. Entro cinque secondi, ho ricevuto notifiche di incidenti tramite telefonata, SMS ed e-mail. La telefonata mi ha letto ad alta voce il servizio che ha causato l'avviso e alcune informazioni di base sull'avviso, oltre a fornirmi opzioni per rispondere come "premere 4 per confermare, 6 per risolvere o premere 8 per intensificare". Ho premuto 4 per confermare e, in base alla mia politica di notifica, in mezz'ora sono stato ri-notificato che la condizione di avviso esisteva ancora (gli unici modi per fermare le notifiche sono risolverli o intensificarli). Le notifiche che ho ricevuto via e-mail e SMS erano simili, con l'avviso via e-mail contenente anche un collegamento al sito PagerDuty in modo che potessi vedere più informazioni. PagerDuty si è comportato egregiamente durante i miei test, notificandomi debitamente in modo tempestivo di incidenti, seguendo la mia politica di escalation e notificandomi nuovamente quando ho trascurato di contrassegnare un problema come risolto.

L'aiuto di PagerDuty è eccellente. Ogni pagina del portale include almeno un collegamento alla guida sensibile al contesto. C'è anche una sezione introduttiva approfondita che copre tutto, dagli argomenti di base come come impostare e rispondere alle notifiche ad argomenti più avanzati come la creazione di una pianificazione su chiamata e la creazione di politiche di escalation. La guida in linea include anche informazioni dettagliate sull'integrazione di PagerDuty con altri strumenti di monitoraggio, risorse per gli sviluppatori e un modulo per l'invio di una richiesta di supporto tecnico.

I rapporti di PagerDuty sono molto semplici e facili da capire. I report possono essere mostrati a livello di sistema o filtrati sulla politica di servizio, team o escalation. Vengono inoltre fornite metriche di riepilogo che mostrano il tempo medio di riconoscimento, il tempo medio di risoluzione, il numero di incidenti intensificati e altro. Queste informazioni sono molto utili dal punto di vista operativo, ma i manager probabilmente vorranno una maggiore profondità per scopi di pianificazione e analisi, nel qual caso vorranno ottenere questi dati da PagerDuty. Se si sottoscrive un piano Enterprise, è possibile esportare report. PagerDuty consiglia di eseguire una query sugli incidenti tramite la loro API anziché esportare i report.

Revisione e valutazione Pagerduty