Skip to Content

MTBF란 무엇이며 어떻게 계산하나요?

평균 고장 간격, 즉 MTBF는 제품 또는 시스템의 수리 가능한 고장 간격의 평균 시간입니다. 이는 시스템 장애의 빈도를 결정하고 시스템 안정성에 대한 개요를 제공하는 핵심 지표입니다.

MTBF는 팀이 잠재적 사고를 예방하거나 줄이는 데 얼마나 성공적인지 판단하는 데 사용할 수 있습니다. 고장 간격이 높을수록 시스템의 안정성이 높아집니다.

MTBF는 무엇을 측정합니까? 안정성 vs. 가용성

MTBF는 컴포넌트 또는 시스템의 안정성과 가용성을 추적하는 역할을 합니다.

안정성은 시스템 또는 구성 요소가 특정 기간 동안 장애 없이 설계된 대로 작동할 확률입니다. MTBF는 시스템 안정성의 기본 척도입니다. MTBF가 높을수록 제품의 안정성이 높아집니다. MTBF를 다른 장애 지표 및 유지보수 전략과 함께 사용하면, 팀이 장애가 발생하기 전에 예방 조치를 구현하는 방법과 시기를 더 잘 결정할 수 있기 때문에 자산 장애를 보다 쉽게 예측할 수 있습니다.

가용성은 시스템 또는 구성 요소가 필요할 때 설계된 대로 작동하는 기능입니다. 평균 복구 시간(MTTR)과 결합된 MTBF는 특정 시간 내에 시스템이 고장날 가능성을 결정할 수 있습니다. 시스템의 가용성은 MTBF를 MTTR과 MTBF의 합계로 나누어 계산할 수 있습니다.

가용성 = MTBF / (MTBF + MTTR)

MTBF 계산 방법: 단계별 포뮬러

MTBF는 특정 기간의 총 운영 시간을 동일한 기간의 장애 횟수로 나누어 계산합니다. 계산 방법은 다음과 같습니다.

시스템의 총 운영 시간을 확인하려면 특정 기간 동안 시스템을 모니터링해야 합니다.

  • 총 운영 시간은 시스템이 고장 없이 실행된 총 시간입니다.
  • 총 실패 횟수는 지정된 기간 내에 시스템이 실패한 횟수입니다.

예를 들어, 24시간 동안 시스템이 3개의 개별 인시던트 동안 3시간의 다운타임을 경험한다고 가정해 보겠습니다.

  • 총 가동시간 = (24 - 3) = 21시간
  • 총 인시던트 수 = 3
  • MTBF = 총 가동 시간/사고 수
  • MTBF = 21/3 = 7시간

고장률로부터 MTBF를 계산하는 방법

전술한 바와 같이, MTBF는 총 가동시간을 기록된 장애 수로 나누어 계산할 수 있다. 반면 고장률은 MTBF의 역수이며 고장 횟수를 총 가동 시간으로 나누어 계산합니다.

MTBF는 다음과 같이 고장률로부터 계산할 수 있습니다. MTBF = 1/고장율

대표적인 경우는 다음과 같습니다.

  • 고장률 = 25개 고장/1,000시간 가동
  • 실패율 = 0.025
  • MTBF = 1 / 0.025
  • MTBF = 40

좋은 MTBF란?

시스템 또는 구성 요소의 장애 사이의 시간은 구성, 작동 조건, 수명 및 기타 외부 요인과 같은 요인에 따라 달라질 수 있기 때문에, 하나의 “좋은” MTBF 메트릭은 없습니다. 대신, 특정 자산에 대해 MTBF를 계산해야 하며, 더 많은 데이터를 수집하면 더 정확해집니다.

높은 MTBF는 무엇을 의미할까요?

물론, 보편적으로 수용되는 목표 MTBF가 없을 수도 있지만, MTBF가 높을수록 더 좋습니다. MTBF가 높으면 시스템 또는 컴포넌트의 안정성이 높고 수명이 다할수록 문제가 줄어들며, 사고가 적을수록 다운타임이 줄어들고 비용이 절감됩니다.

낮은 MTBF는 무엇을 의미할까요?

낮은 MTBF는 시스템이 더 자주 고장날 가능성이 높으며 시스템의 안정성을 검토해야 함을 의미합니다. MTBF 및 기타 장애 지표를 모니터링하기 위한 툴을 구현하고 예방 유지보수 계획을 수립하면 시스템 안정성을 개선할 수 있습니다.

MTBF 계산 예시

다음으로, 30일 동안 운영되는 생산 시스템과 관련된 낮은, 평균 및 높은 MTBF의 몇 가지 예를 살펴보겠습니다.

낮은 MTBF

시스템이 30일(720시간) 이내에 4시간 동안 6회 다운되어 총 중단 시간이 24시간이라고 가정해 봅시다.

  • 총 가동시간 = (720 - 24) = 696시간
  • 총 인시던트 수 = 6
  • MTBF = 총 가동 시간/사고 수
  • MTBF = 696 / 6 = 116시간(약 5일)

5일마다 가동이 중단되면 비즈니스 운영과 고객에게 영향을 미치는 매우 불안정한 시스템을 의미합니다.

평균 MTBF

이제, 시스템이 한 번에 2시간씩 동일한 30일(720시간) 이내에 단 2회만 다운되어 총 4시간의 중단 시간을 갖는다고 상상해 보십시오.

  • 총 가동시간 = (720 - 4) = 716시간
  • 총 사고 수 = 2
  • MTBF = 총 가동 시간/사고 수
  • MTBF = 716 / 2 = 358시간(약 15일)

이는 매우 높은 MTBF는 아니지만, 일부 비즈니스 사용 사례에서는 15일마다 한 번의 장애가 허용될 수 있습니다.

높은 MTBF

마지막으로, 2시간 동안 30일(720시간) 이내에 단 한 번만 다운되는 시스템을 생각해 보십시오.

  • 총 가동시간 = (720 - 2) = 718시간
  • 총 인시던트 수 = 1
  • MTBF = 총 가동 시간/사고 수
  • MTBF = 718 / 1 = 718시간(약 30일)

여기에 설명된 다른 시나리오와 비교했을 때, 30일마다 한 번의 장애는 높은 MTBF로 간주될 수 있으며, 이는 시스템이 매우 안정적임을 나타냅니다.

MTBF 계산 방법: 세 가지 시나리오

MTBF는 여러 기술 영역에서 유용한 안정성 지표입니다. 사이버 보안, 사고 대응 및 DevOps스에 대한 몇 가지 시나리오를 살펴보겠습니다.

사이버 보안에서 MTBF 계산

사이버 보안의 경우, MTBF는 시스템이 수명이 거의 다했으며 심각한 정전의 위험이 증가하고 있음을 나타낼 수 있습니다.

예를 들어, 사이버 보안 시스템이 48시간 동안 관찰된다고 가정해 보십시오. 이 시간 동안 시스템은 총 8시간의 다운타임 또는 총 40시간의 운영 시간으로 5회 고장납니다.

MTBF = 40 / 5 = 8시간

다음 달, 시스템은 48시간에 걸쳐 다시 관찰됩니다. 이번에는 총 12시간의 다운타임 또는 총 36시간의 운영 시간에 8개의 장애가 발생합니다. 시스템의 MTBF는 이제 4.5시간입니다.

MTBF = 36 / 8 = 4.5시간

후속 관찰 중에 MTBF가 계속 떨어지는 경우, 이는 시스템의 영역 또는 전체 시스템 자체를 교체하거나 강화해야 함을 암시할 수 있습니다.

사고 대응 시 MTBF 계산

또한 MTBF는 침해 사고 대응팀이 침해 사고를 최소화하고 예방하는 데 얼마나 효과적인지 파악하는 데 도움을 줄 수 있습니다. MTBF가 너무 낮거나 하향 추세인 경우, 팀은 사고 데이터를 분석하여 반복적인 정전 및 우려되는 추세를 파악해야 합니다.

DevOps스의 MTBF 계산

DevOps스의 MTBF는 기능 또는 단일 구성 요소에 대한 장애 빈도를 측정하여 팀이 서비스의 안정성 및 가용성 수준을 예측할 수 있도록 합니다. 이러한 방식으로 부품 설계 또는 테스트 및 유지보수 프로세스의 약점을 강조할 수 있습니다.

DevOps 팀은 MTBF를 모니터링함으로써 프로세스와 시스템 인프라를 개선하여 장애로 이어질 수 있는 비효율성과 병목현상을 발견하고 제거할 수 있습니다. 팀이 개선함에 따라 MTBF가 증가하여 보다 안정적인 시스템을 제공합니다.

예를 들어, 5일 동안 코드 통합 파이프라인의 총 작업이 100시간이었던 예를 생각해 보십시오. 주간에는 4가지 장애가 발생합니다.

  • 총 작동 시간 = 100시간
  • 총 장애 횟수 = 4
  • MTBF = 총 작동 시간 / 장애 횟수
  • MTBF = 100 / 4 = 25시간

MTBF를 모니터링하려면 어떤 도구가 필요할까요?

올바른 툴을 사용하면 MTBF 및 기타 유지보수 지표를 향상시킬 수 있습니다. 이러한 도구에는 인프라 모니터링 도구, 서비스 모니터링, 시각화 도구, 애플리케이션 성능 모니터링 도구, 교차 플랫폼 및 데이터 집계 도구, 프로젝트 관리 도구가 포함됩니다.

그러나 이러한 모든 툴에는 최대 성능을 유지하면서 방대한 양의 데이터를 처리할 수 있는 빠른 고성능 스토리지가 필요합니다. 퓨어스토리지 ® 플래시블레이드(FlashBlade)®를 사용하면 MTBF 지표를 향상시키는 데 필요한 고급 모니터링 및 관찰 도구를 지원하는 강력한 고성능 스토리지 솔루션을 만들 수 있습니다.

MTBF 이후 다음 지표는?

MTBF와 평균 고장 시간(MTTF)은 모두 시스템 또는 구성 요소의 성능을 평가하는 시간을 측정하는 데 사용됩니다.

MTTF에 대해 자세히 알아보세요.

10/2024
Pure Storage and IBM QRadar
IBM QRadar and Pure Storage have teamed up to deliver event ingestion from Pure Storage FlashArray™ and FlashBlade® systems to enhance threat detection and reduce response times.
솔루션 브리프
3 페이지
연락처
질문하기

퓨어스토리지 제품이나 인증 관련 질문이나 코멘트가 있으신가요?   저희가 도와드립니다.

데모 예약

라이브 데모를 예약하고 퓨어스토리지가 데이터를 어떻게 강력한 결과로 전환해주는지 직접 확인해 보세요. 

연락하기: +82 2 6001-3330

언론홍보팀:  pr@purestorage.com

 

퓨어스토리지코리아 주소

30F 아셈타워,

517 영동대로,

강남구, 서울

대한민국

korea@purestorage.com

닫기
지원하지 않는 브라우저입니다.

오래된 브라우저는 보안상 위험을 초래할 수 있습니다. 최상의 경험을 위해서는 다음과 같은 최신 브라우저로 업데이트하세요.