[Ücretsiz Ebook] BT ve iş ekipleri için hizmet sunumunda başarı matrisi.Şimdi indirin

Metrikler IT hizmet yönetiminin kalbinde yer alır, operasyonlar hakkında içgörü sağlar ve sürekli iyileştirme alanlarının belirlenmesine yardımcı olur. Olağan hizmet masası metrikleri, dahili operasyonel verimliliğin gösterilmesine yardımcı olur. Örneğin, belirlenen sürenin altında çözüme kavuşturulan çağrı sayısını ölçen SLA, hizmet masası verimliliğini gösteren önemli bir faktördür. Öte yandan, arıza metrikleri ekiplerin IT altyapısındaki zayıf noktaları tespit etmesine ve arıza olaylarına verilen yanıtların değerlendirilmesine yardımcı olur. Bu da IT ekiplerinin arızaların, kritik sistemler üzerinde neden olabileceği kademeli etkiyi en aza indirmesine yardımcı olur.

İzlenecek kilit arıza metrikleri nelerdir? Bu makalede aşağıdaki üç KPI’yi göreceğiz:

  • Arızalar arası ortalama süre
  • Arızaya kadar geçen ortalama süre
  • Ortalama onarım süresi
 

Arızalar arası ortalama süre (MTBF)

Arızalar arası ortalama süre (MTBF)

Ağlar, sunucular, iş istasyonları gibi IT altyapı varlıklarında sık sık arızalar meydana geldiğinde, IT ve iş hizmetlerinin kullanılabilirliği üzerinde kademeli bir etkileri olur. Bu aksaklıklar gelir ve itibar kaybına yol açar. Belirli bir IT varlığı sık sık kesintiye uğruyorsa sık sık onarım yapılması veya varlığın yenisiyle değiştirilmesi gerekir. Öncesinde ise varlığın neden sık sık ve hangi koşullarda arızalandığının araştırılması ve anlaşılması, sürece yardımcı olur. Bu da varlık bakımının planlanmasına ve sistem kullanılabilirliğinin iyileştirilmesine yardımcı olur. MTBF, kesinti nedenlerini belirlemeye yardımcı olan ve bunları azaltmaya veya hızlı kurtarma ve IT sistemlerinin daha iyi kullanılabilirliğini planlamaya yardımcı olan metriktir.

MTBF ölçümleri ve hesaplaması

Şekil 1. Arızalar arası ortalama süre

Belirli bir IT varlığının MTBF'sinin düşük olması, varlığın sık sık kesintiye uğrayarak IT ve iş kesintilerine yol açtığı anlamına gelir.

MTBF örneği

Bir şirkette yeni Windows ürün yazılımı her güncellendiğinde depolama sürücüsüne yapılan yeni güncellemeler çökmeye devam ediyordu. Bu durum birkaç kez yaşandıktan sonra MTBF daha da kötüleşti. Ekip, sorunu analiz ettikten sonra üçüncü taraf sürücünün, güncellemeyi gerçekleştirmek için gereken API'nin ya uygulanmamasına ya da hatalı olmasına neden olduğunu belirledi. Yeni bir güncelleme planlandığında, üçüncü taraf sürücüler gerekli API'leri uygulamıyorsa keşfedilecek iki olası çözüm vardır. API'leri SATA ve NVMe depolama protokolleri için Windows alternatifleriyle değiştirme veya OEM'den sürücünün yeni ve daha iyi desteklenen bir sürümünü edinme güncellemelerin uygulanmasına, hataların düzeltilmesine ve güvenlik boşluklarının kapatılmasına yardımcı olabilir. Sürücü yükseltmelerinin ve kesinti sürelerinin izlenmesi ve takip edilmesi, depolama sürücülerinin kullanılabilirliğini artırmaya yardımcı olur.

MTBF nasıl iyileştirilir?

  • Arızaları takip etme ve izleme amacıyla varlık sağlığını gözlemlemeye yönelik bir süreç uygulayın. Bu durum aksaklıkların nedenini belirlemeye yardımcı olur.
  • Farkındalık yaratmak, uzun vadeli nedenleri ele almak ve varlık performansını iyileştirmek için sorunun kök nedenini analiz edin.
  • Kuruluşları etkileyen kesinti sürelerini verimli şekilde ele alarak azaltmaya yönelik bir hızlı yanıt stratejisi oluşturun.
 

Arızaya kadar geçen
ortalama süre (MTTF)

Arızaya kadar geçen ortalama süre (MTTF)

Varlıkların düzenli olarak arızalanması, kuruluşunuzun IT operasyonlarını kesintiye uğratabilir ve IT altyapısının bozulmasına ve düşük performans göstermesine neden olabilir. MTTF metriği bir varlığın, cihazın veya bileşenin tipik ömrünü belirlemeye yardımcı olur. Düşük MTTF'ye sahip IT varlıkları ve bileşenleri için, bileşeni onarmak yerine IT bileşenini değiştirmek genellikle zaman açısından daha verimlidir ve operasyonel etki ve maliyetleri en aza indirir.

Bu durum özellikle bir ana bilgisayar sunucu yığını veya bir ağ erişim noktası gibi altyapının önemli operasyonel unsurlarına bağlı IT bileşenleri için geçerlidir.

Arızaya kadar geçen ortalama süre (MTTF)

Şekil 2. Arızaya kadar geçen ortalama süre

Bir varlığın MTTF'si elverişli değilse ve sık sık soruna yol açıyorsa IT varlığının güvenilmez olduğunu ve IT operasyonlarını etkilememek için sık sık değiştirilmesi gerektiğini gösterir.

MTTF örneği

Bir IT yazılım geliştirme şirketinde, bir kablo veri ve ağ sunucusu yığınındaki anahtardan bağlandığında veya çıkarıldığında, ağ kabloları gevşiyor, bağlantı kesiliyor veya hasar görüyordu. Bu durum veri aktarımının kesintiye uğraması nedeniyle dosyaların bozulmasına yol açıyordu. Ağ ekibi tarafından yapılan ileri analizler, CAT6 RJ45 bağlantı kablosundaki takılmayan plastik kapağın kırılıp durduğunu gözler önüne serdi. Nedeni, kablonun ucuz malzeme kullanan bir üreticiden temin edilmiş olmasıydı. Bunun üzerine IT ekibi, ileride kablolar taşındığında veri kaybı veya bozulması gibi sorunların yaşanmayacağından emin olmak için eski kabloları daha kaliteli kablolarla değiştirdi. Bu örnek klasik bir örnektir, ancak kablonun MTTF'sinin düzenli olarak izlenmesi IT ekiplerinin bileşenler gibi kritik varlıkların etkisini anlamalarına yardımcı olur, böylece onarım ve yenisiyle değiştirme konusunda bilinçli kararlar verebilirler.

MTTF nasıl artırılır

  1. Yüksek kaliteli varlıklar satın alarak ve düşük kaliteli ve maliyetli varlıkları hizmet dışı bırakarak varlık ömrünü uzatın.
  2. Kritik varlıklara bağlı bileşenler üzerinde düzenli kontroller planlayarak iş operasyonlarında büyük ölçekli kesintileri önleyin.
  3. Bir varlığın operasyonel olduğu süreyi tahmin eden ve böylece varlık depolama için genel giderleri azaltan bir vakitli envanter süreci uygulayın.

Ortalama onarım
süresi (MTTR)

Ortalama onarım süresi (MTTR)

Kritik bir IT sistemi arızalandığında, IT ekipleri sistemi mümkün olan en kısa sürede çalışır hale getirmelidir. IT sistemlerinin geri yüklenmesindeki gecikmeler gelir kaybına yol açabilir ve kritik iş operasyonlarını etkileyebilir. İyi organize edilmiş bir kurtarma ve yanıt sistemi, IT ekiplerinin planlanmamış kesinti sürelerine yanıt vermesine ve operasyonları etkili şekilde geri yüklemesine yardımcı olabilir. MTTR, bir varlığı onarmak veya sorununu gidermek ve operasyonel kapasitesine geri döndürmek için geçen ortalama süreyi ölçer.

MTTR örneği

Şekil 3. Ortalama onarım süresi

MTTR arttıkça kesinti süresinin maliyeti de artar. Yüksek MTTR, kurtarma ve müdahale operasyonlarınızın hızlı ve etkili olmadığını gösterir. Sistem arızaları kaçınılmazdır ancak MTTR, ekiplerin varlık arızalarına zamanında ve stratejik şekilde yanıt vermesini sağlar.

MTTR örneği

Bir yazılım şirketi, bir koddaki açık nedeniyle geliştirmekte olduğu video oyununda sıfırıncı gün saldırısıyla karşı karşıya kaldı. Saldırı, wi-fi ve gözetim sistemleri gibi operasyonları sekteye uğrattı. Bu da saldırganların kuruluşun ağ etki alanına ve gizli iş dosyalarına erişmesine yol açtı. Siber güvenlik ekibi, çalışanları sıfırıncı gün saldırıları ve bu saldırıları nereye bildirebilecekleri konusunda bilgilendirdi. Kuruluştaki her IT varlığı yeni nesil antivirüs (NGAV) ile donatıldı. Saldırı LAN ve çalışan self-servis portalını devre dışı bırakarak kuruluşun operasyonlarını sekteye uğrattı. Siber güvenlik ekibi, saldırının ilk saati içinde durumdan haberdar edildi ve NGAV'ın tehdit analizlerinden ve kullanıcıların davranış kalıplarından yararlanan kabiliyetinin yardımıyla şüpheli faaliyeti tespit etti. Siber güvenlik ekibi, koddaki açığı gidermek için derhal bir yama yönetimi komut dosyası çalıştırdı ve operasyonların daha fazla etkilenmesini ve veri hırsızlığını önlemek için tesis içi ağını kilitledi.

MTTR nasıl azaltılır?

  1. Etkin bir varlık yönetimi stratejisi, darboğazları belirleyerek ve varlıkların onarılmasını veya değiştirilmesini belirleyerek daha iyi karar vermeye yardımcı olur. Bu da para ve depolama alanı tasarrufu sağlar.
  2. Olay tespit ve çözüm sürecini kolaylaştırmak için teknisyenlerin sorumluluklarını ve rollerini tanımlayın.
  3. Arıza süresi boyunca iletişimsizliği ve karışıklığı azaltmak için teknisyenlere detaylı standart işletim prosedürleri sağlayın.
  4. Varlık bakım ve izleme bilgilerini merkezileştiren bir Kurumsal Varlık Yönetimi çözümü kullanarak MTTR'yi ölçün. Bu durum aynı zamanda varlıkların kullanımını optimize etmeye, varlık verilerini toplamaya ve olası arıza sürelerini tahmin etmeye yardımcı olur.
 

Sonuç

MTBF, MTTR ve MTTF

Bu arıza metrikleri, ekiplerin operasyonlardaki darboğazları ve olaylara verdikleri yanıtları belirlemelerine yardımcı olur. Kalıcı olayların temel nedenini belirleyerek IT ekiplerinin daha yüksek operasyonel verimlilik elde etmelerini sağlar. IT ekipleri, IT operasyonlarının etkilendiği alanların net bir resmiyle olay müdahale stratejilerini geliştirebilir. Bu metrikler, kuruluşlarda sadece performans hedefleri olarak değil, KPG’ler olarak kullanılarak uygulanabilir. Metrikler, yalnızca ulaşılması gereken hedefler olmayıp, süreç basitleştirme ve operasyonel iyileştirme alanlarına işaret eder.

Her metriğin hızlı bir özeti:

  • MTBF hizmet masanızın gelecekteki aksaklıkları önlemedeki etkinliği hakkında daha iyi içgörüler sağlar.
  • MTTF bir varlığın yaşam döngüsünü ve güvenilirliğini anlamanıza yardımcı olur.
  • MTTR onarım için harcanan zamanı ve IT ekiplerinizin aksaklıkları ne kadar hızlı teşhis edebildiğini gösterir.
Saket

Yazar Hakkında

ManageEngine ServiceDesk Plus'ta ürün uzmanı olan Saket Pasumarthy, bir ITSM meraklısıdır ve IT alanındaki en son gelişmeleri takip etmeye meraklıdır. Saket, IT hizmet yönetimi ekiplerinin küresel olarak hizmet yönetimi zorluklarının üstesinden gelmesine yardımcı olan makaleler ve bloglar yazmaktadır. Ayrıca ServiceDesk Plus Masterclass serisinde kullanıcı eğitimi oturumları sunmaktadır. Saket boş zamanlarını futbol oynayarak ve uçuş simülatöründe uçak uçurarak geçiriyor.

 

 

 

 

Sıkça Sorulan Sorular

MTTR, bir IT bileşeninin veya sisteminin onarımı için geçen toplam sürenin, ilgili zaman diliminde yapılan toplam onarım sayısına bölünmesiyle elde edilir.

Toplam onarım süresi
  Toplam onarım sayısı

Örneğin: Yazıcı haftada üç kez bozulur ve tamir edilmesi 1 saat, 4 saat ve 0,5 saat sürer. MTTR (1+4+0.5)/3 = 5.5/3 = 1.83 saattir.

Araç kitimizle IT olay yönetim uygulamalarınızı hızla değerlendirin

  • Olay tanımlamadan kapatmaya kadar temel olay yönetimi uygulamalarınızı ölçmeye yönelik kendi kendine puan veren bir değerlendirme
  • Hibrit çalışma ortamı için ekibinizin büyük olaylarla başa çıkmaya hazır olup olmadığını gözden geçirmeye yönelik bir kontrol listesi
  • Hibrit çalışma modelinde karşılaşılan yaygın olay yönetimi zorluklarının üstesinden gelmeye yardımcı olacak bir hatırlatma kâğıdı

Bu yıl ITSM aracınızı yenilemeyi mi düşünüyorsunuz? *

'Araç kitini indir' seçeneğine tıklayarak kişisel verilerin Gizlilik Politikası göre işlenmesini kabul ediyorsunuz.

 

 

Dünyanın en iyi kuruluşlarının güvenini kazandık

360° ITSM’nin gücünü açığa çıkarın.
Back to Top