5 Praktik Terbaik untuk Mengotomatisasi Manajemen Insiden Utama

Pengarang: Roger Morrison
Tanggal Pembuatan: 27 September 2021
Tanggal Pembaruan: 21 Juni 2024
Anonim
Problem Management | ITIL V3 Foundation | ITIL Basics | Simplilearn
Video: Problem Management | ITIL V3 Foundation | ITIL Basics | Simplilearn

Isi



Sumber: Pixtum / iStockphoto

Bawa pulang:

Dengan strategi otomatisasi pintar, Anda dapat membuat respons insiden lebih cepat dan lebih mudah dari sebelumnya - meminimalkan waktu henti dan potensi pelanggaran keamanan.

Insiden TI besar terjadi dalam perusahaan setiap hari. Meskipun hanya segelintir yang menjadi berita utama, peristiwa seperti pemadaman dan pelanggaran keamanan dapat secara serius melumpuhkan produktivitas karyawan, secara negatif memengaruhi persepsi pelanggan, dan yang paling penting, mengakibatkan hilangnya pendapatan.

Jadi ketika datang untuk mengelola insiden TI besar, yang terbaik adalah fokus pada dampak bisnis dan garis bawah. Menurut Ponemon Institute, biaya rata-rata waktu henti di 2016 adalah $ 8.851 per menit - itu lebih dari $ 500.000 per jam, dan rata-rata waktu henti rata-rata lebih dari 90 menit. Dan ini hanya biaya langsung! Dampak jangka panjang seperti kerusakan reputasi dan gesekan pelanggan tidak dapat diprediksi dan berpotensi menjadi bencana besar.


Meskipun Anda tidak dapat sepenuhnya menghindari semua insiden besar, Anda dapat mempersenjatai organisasi Anda untuk bersiap-siap untuk menanganinya saat muncul. Dan komponen utama dari strategi Anda adalah menggabungkan otomatisasi. Organisasi yang memaksimalkan penggunaan otomatisasi dalam proses resolusi insiden utama mereka mencapai pemulihan layanan yang lebih cepat dan kesalahan yang jauh lebih sedikit karena kesalahan manusia. Ini karena otomatisasi berdampak langsung pada kemampuan Anda untuk mengecilkan durasi jendela dampak bisnis - atau periode yang mahal di mana pengguna dan operasi bisnis Anda benar-benar merasakan dampak dari suatu insiden. (Untuk mempelajari lebih lanjut tentang otomatisasi, lihat Otomasi: Masa Depan Ilmu Data dan Pembelajaran Mesin?)

Untuk memaksimalkan manfaat otomatisasi, Anda harus memeriksa kegiatan mana yang perlu dilakukan selama jendela dampak, dan mencari tahu cara memindahkan semua kegiatan lain baik sebelum insiden dimulai atau setelah bisnis kembali ke operasi normal. Berikut adalah lima cara untuk memulai.


1. Kembangkan & Tentukan Proses

Mendefinisikan proses manajemen insiden utama adalah menentukan dengan tepat apa yang dapat direncanakan, dikoordinasikan, atau dieksekusi selama insiden. Ini dapat berarti mengidentifikasi anggota tim pendukung utama melalui skillet dan jadwal, misalnya, sehingga meja layanan Anda dapat melibatkan mereka secepat dan seefisien mungkin. Ini juga berarti mencari tahu bagaimana Anda akan menyampaikan informasi yang relevan ke tim Anda sehingga mereka dapat mulai menyelesaikan masalah segera, serta menjaga agar para pemangku kepentingan yang tepat mendapatkan informasi dan informasi terbaru.

Otomasi sangat penting untuk aspek-aspek kunci dari proses ini. Misalnya, Anda dapat secara otomatis memasukkan informasi yang relevan dari alat pemantauan Anda di tiket meja layanan Anda, atau memasukkan informasi dari meja layanan dalam pemberitahuan kepada penyelesai insiden. Anda juga dapat mendokumentasikan seluruh kejadian ke satu sumber kebenaran komprehensif yang dapat diakses oleh semua. Ingatlah bahwa Anda dapat mempraktikkan proses ini untuk memperbaikinya - Anda tidak perlu menunggu insiden dunia nyata untuk menguji pendekatan Anda.

2. Dapatkan Infrastruktur Anda Benar

Di hari ini dan usia keletihan waspada, penting bagi Anda untuk tidak terus membombardir tim Anda dengan pemberitahuan dan informasi yang tidak relevan yang tidak berlaku bagi mereka. Menerapkan filter ke peringatan pemantauan Anda akan memberdayakan tim Anda untuk lebih mudah membidik jarum di tumpukan jerami kebisingan rutin. Ini adalah kunci untuk membuat semua wawasan dan data Anda benar-benar dapat ditindaklanjuti, bukan hanya menambah informasi yang berlebihan.

Cara yang baik untuk mengotomatiskan termasuk menggunakan solusi APM untuk merayapi semua aplikasi dan sistem Anda untuk secara proaktif menentukan penyebab utama pada titik penurunan kinerja apa pun, sebelum menyebabkan pemadaman layanan yang besar. Anda juga dapat mengintegrasikan pemantauan, meja layanan, aplikasi kolaborasi, dan alat obrolan Anda untuk berbagi informasi secara langsung.

Tanpa Bug, Tanpa Stres - Panduan Langkah Demi Langkah Anda untuk Membuat Perangkat Lunak yang Mengubah Hidup Tanpa Menghancurkan Kehidupan Anda

Anda tidak dapat meningkatkan keterampilan pemrograman Anda ketika tidak ada yang peduli dengan kualitas perangkat lunak.

3. Mengukur MTTR dengan Akurat

Bagaimana Anda mengukur mean time to repair (MTTR)? Apakah Anda mendasarkannya pada total waktu tim TI dilibatkan, atau pada total waktu ketika bisnis benar-benar terpengaruh? Jika jawaban Anda adalah yang pertama, Anda harus mempertimbangkan kembali mengukur dampak jendela menggunakan perspektif bisnis sebagai gantinya. Ini adalah tipuan yang jauh lebih akurat untuk upaya optimalisasi Anda, karena tujuan Anda adalah untuk meminimalkan dampak insiden, dan tidak sekadar menyajikan laporan respons yang lebih baik kepada dewan Anda. (Untuk mempelajari lebih lanjut tentang waktu henti dan cara menanganinya, lihat What Mean Time Between Failures Really Means.)

Anda dapat mengotomatisasi dengan memberikan visibilitas penuh ke dalam aplikasi untuk secara retroaktif "memulai waktu" jika perlu, dan menyimpan catatan lengkap dari aktivitas resolusi Anda dan komunikasi untuk analisis dan audit untuk meningkatkan proses Anda.

4. Terus Informasikan Stakeholder - Tetapi Tanpa Mengganggu Resolusi

Stakeholder mengharapkan komunikasi yang efektif dan tepat waktu sementara juga mengharapkan para ahli materi untuk tetap berfokus pada laser untuk memperbaiki masalah. Meskipun Anda dapat menunjuk titik komunikasi untuk memantau dan melibatkan pengguna bisnis, strategi yang lebih efektif adalah membuat halaman web swalayan dengan pembaruan status. Ini memberdayakan pemangku kepentingan untuk memeriksa diri mereka sendiri tanpa membombardir tim Anda dengan panggilan dan s selanjutnya. Ingatlah untuk memperbarui pemangku kepentingan Anda secara berkala sehingga mereka selalu menerima, dan tahu untuk mengharapkan, laporan status terbaru. Jangan lupa bahwa komunikasi tidak boleh berhenti hanya karena layanan dipulihkan! Para pemangku kepentingan yang penting mendapatkan ringkasan tentang apa yang terjadi, apa yang telah dipelajari, dan bagaimana situasinya dapat dicegah di masa depan.

Otomasi dalam hal ini dapat diimplementasikan untuk membuat halaman status otomatis waktu nyata bagi para pemangku kepentingan, serta membuat perintah slash ke alat obrolan Anda untuk memperbarui halaman itu.

5. Kumpulkan Data untuk Mendukung Manajemen Masalah

Mengembalikan layanan tidak mewakili akhir dari manajemen insiden! Bahkan, beberapa kegiatan yang paling berharga terjadi setelah resolusi. Dengan mengumpulkan data diagnostik dan dampak dan melakukan analisis akar penyebab, Anda dapat melakukan audit penuh atas insiden besar yang mencakup tindakan pencegahan untuk menghindari insiden serupa di masa mendatang. Selain itu, bahkan jika insiden yang dikenali tidak terjadi lagi, Anda dapat membuat prosedur yang ditentukan untuk jenis data apa yang perlu Anda kumpulkan dan langkah-langkah yang perlu terjadi untuk mendorong resolusi. Dengan cara ini tim Anda hanya perlu merujuk ke daftar periksa dan fokus pada tujuan inti mereka memulihkan layanan, daripada mengkhawatirkan apa yang mereka butuhkan dan kapan.

Otomatisasi di sini dapat menangkap dan menjaga aktivitas resolusi, termasuk hal-hal seperti transkrip obrolan, dalam satu sistem catatan untuk analisis. Selain itu, ini akan membantu Anda membangun katalog insiden atau masalah yang sudah dikenal, memperkuat praktik terbaik untuk masing-masing, dan karenanya meningkatkan kecepatan resolusi di masa depan.

Kesimpulannya: Otomatiskan Lebih Cerdas, Tidak Lebih

Berhati-hatilah bahwa lebih banyak otomasi belum tentu merupakan pendekatan yang lebih baik! Lebih penting bagi Anda untuk memahami kapan, di mana, dan bagaimana menghubungkan sistem TI Anda bersama-sama untuk mendukung manajemen insiden. Anda tidak ingin menambahkan kompleksitas yang tidak perlu demi meningkatkan proses otomatis. Ingat tujuannya adalah menyederhanakan dan mengkonsolidasikan operasi sebanyak mungkin untuk membuat tim Anda merasa diberdayakan untuk mengatasi masalah secara efisien. Ini tentang otomatisasi implementasi cerdas untuk memfasilitasi serangkaian proses yang terkoordinasi dengan baik, staf berpengetahuan dan komunikasi pemangku kepentingan yang efektif, sehingga dapat meminimalkan dampak bisnis secara keseluruhan dari insiden besar.