Skip to Content

사이트 안정성 엔지니어란?

사이트 안정성 엔지니어(SRE)는 DevOps스의 성공을 지원하고, 미션 크리티컬 서비스의 상태에 대한 가시성을 높이고, 사고 대응 시간을 개선하고, 모든 애플리케이션의 고가용성을 보장할 수 있습니다. 이 문서에서는 SRE가 무엇인지, 그리고 소프트웨어 개발 수명주기(SDLC)의 전반적인 품질과 안정성을 개선하는 데 SRE가 어떻게 도움이 될 수 있는지 알아봅니다. 

사이트 안정성 엔지니어란?

현장 신뢰성 엔지니어는 IT 운영의 모니터링, 자동화 및 신뢰성을 담당합니다. 소프트웨어 개발 툴을 사용하여 변경 관리, 사고 대응 및 프로덕션 시스템 관리와 같은 IT 운영 작업을 자동화합니다. 또한 소프트웨어 배포 상태를 모니터링하고 로그와 데이터를 개발자에게 전달하는 업무를 담당합니다. 

왜 SRE일까요? 

이니셜 SRE는 현장 신뢰성 엔지니어 또는 현장 신뢰성 엔지니어링 실무를 지칭할 수 있습니다. SRE 실무의 목적은 개발팀이 자주 업데이트하는 경우에도 조직의 서비스와 애플리케이션을 항상 가동하고 사용할 수 있도록 하는 것입니다. 

SRE 역할은 애플리케이션 모니터링 또는 시스템 관리와 같은 일상적인 작업을 간소화할 수 있는 소프트웨어 툴과 자동화에 크게 의존합니다. 개발자가 애플리케이션을 업데이트하면 변경 사항이 애플리케이션에 부정적인 영향을 미치고 성능이 저하되거나 충돌할 수도 있습니다. SRE는 이러한 잠재적 문제를 감시하고 소프트웨어 코드 또는 구현의 오류가 고객에게 만족스럽게 서비스를 제공할 수 있는 조직의 능력에 영향을 미치지 않도록 해야 합니다. 

SRE의 책임 중 가장 큰 부분은 IT 개발과 운영 사이의 버퍼 및 퍼실리테이터 역할을 하는 것입니다. 개발자는 소프트웨어를 빠르고 자주 업데이트하길 원하지만, 운영 팀은 업데이트로 인해 문제가 발생하지 않도록 조금 더 느리게 이동하길 원합니다. 

개발과 운영 간의 균형을 유지해야 하는 이러한 필요성 때문에 SRE는 소프트웨어 엔지니어링, 운영 및 인프라 관리를 포함한 여러 작업을 하나로 통합해야 합니다. 또한 일반적으로 네트워크와 시스템을 생성하고 관리하는 데 매우 능숙하며, 비용이 많이 드는 다운타임과 시스템 중단을 예측하고 예방하는 방법을 알고 있습니다. 

현장 신뢰성 엔지니어는 어떤 일을 합니까?

SRE는 조직의 IT 인프라의 가용성, 성능 및 안정성을 유지하기 위해 노력합니다. 여기에는 시스템의 설계, 구현 및 전반적인 모니터링이 포함되므로 시스템을 최상의 효율성으로 가동 및 실행할 수 있으며, 최종 사용자가 원하는 종류의 직관적이고 응답 가능한 경험을 항상 제공할 수 있습니다.  

SRE는 소프트웨어 툴을 활용하여 로그 분석, 애플리케이션 및 시스템 패치 적용 및 업데이트, 프로덕션 환경 테스트 등과 같은 중요한 운영 작업을 자동화하고 간소화할 수 있습니다. 또한 모든 시스템을 면밀히 관리하고, 발생하는 모든 문제를 감지 및 해결하며, 사고 발생 후 사후 관리를 수행하여 발생한 문제와 향후 예방 방법을 분석합니다.  

기타 책임은 다음과 같습니다. 

  • 모든 애플리케이션에 안정성이 설계 및 구축되도록 개발자와 컨설팅
  • 운영팀과 협력하여 신규 및 업데이트된 애플리케이션이 기존 IT 인프라에서 충분한 지원을 받고 있는지 확인
  • 용량 요구사항, 시스템 성능 및 복원성에 대한 예측 및 계획
  • 주요 지표를 서비스 수준 지표(SLI) 및 서비스 수준 목표(SLO)로 설정하여 시간 경과에 따른 진행 상황 및 성공 측정
  • 소프트웨어 개발 수명 주기 개선, 특히 사고 발생 후
  • 시스템 확장, 자동화 구현 및 새로운 기능 생성으로 개발팀 지원
  • 지원 에스컬레이션 문제에 대응하고 해결

SRE는 DevOps 동일할까요? 

SRE는 DevOps스와 동일하지 않지만, 각 팀의 목표에는 일부 유사점이 있습니다. SRE와 DevOps스는 개발과 운영이 보다 긴밀히, 보다 효과적으로 작동하기를 원합니다. SRE와 DevOps스는 모두 자동화 및 시스템 최적화에 크게 유리합니다. 

기존의 DevOps 관행을 통해 전반적인 협업이 향상되고 소프트웨어 개발 주기가 빨라졌지만, 데DevOps스는 일반적으로 사이트 성능 및 안정성을 개선하거나 향상시키는 개발 추진을 담당하는 팀원이 없었습니다. SRE가 빛을 발하는 곳입니다. SRE의 유일한 목적은 전체 시스템에 걸쳐 안정성과 확장성을 제공(또는 유지)하는 것입니다. 

DevOps스가 속도와 민첩성에 중점을 두는 경우, SRE는 인프라 관리와 인프라의 가용성 및 고성능 유지에 중점을 둡니다. DevOps스는 조직의 문화적 접근 방식이지만, SRE는 데DevOps스를 지원하는 동시에 최고의 운영을 보장하기 위해 고도로 전문화된 기술을 사용합니다. 

DevOps스 문화 내에서도 SRE는 IT 운영과 개발의 가교 역할을 합니다. 품질 보증의 역할을 하는 경우가 많지만, 선제적인 QA입니다. SRE는 종종 시스템 안정성과 개발 속도 간의 이상적인 균형을 정의하여 DevOps스가 성공할 수 있도록 하는 중요한 요소입니다. 

SRE에는 어떤 기술이 필요할까요?

SRE는 IT 운영과 개발자 간의 가교 역할을 하기 때문에 매우 다양한 기술이 필요합니다. 오늘날의 SRE 중 다수는 운영 측면에서 경험이 있는 이전 소프트웨어 개발자 또는 코딩 방법을 알고 있는 시스템 관리자입니다. 

SRE는 확장 가능한 복원성 IT 시스템을 설계하고 구축하는 방법을 알아야 합니다. 다양한 클라우드 컴퓨팅 플랫폼을 이해해야 합니다. 또한 네트워크 프로토콜을 구성하고 데이터베이스를 관리하는 방법도 알아야 합니다. 그리고 무엇보다도 뛰어난 문제 해결 및 커뮤니케이션 기술이 필요합니다. 

기타 유용한 기술에는 다음이 포함될 수 있습니다. 

  • 클라우드와 온프레미스 모두에서 IT 인프라에 대한 심층적인 이해 
  • 컨테이너 기술 및 오케스트레이션 전문 지식
  • 모든 사업부의 파트너, 벤더 및 동료와 전략적 관계를 형성하는 능력
  • 코딩 언어, 모니터링 및 버전 관리 도구, 데이터베이스 및 운영 체제 경험
  • 웹사이트 인프라 관리 및 유지보수
  • 지속적 통합/지속적인 개발(CI/CD)에 익숙함 
  • 분산 컴퓨팅 시스템 경험

SRE가 필요할까요?

이 질문에 대한 답은 ‘예’입니다! SRE는 그 어느 때보다 수요가 증가하고 있으며, 이러한 모멘텀은 속도 저하의 징후를 보이지 않습니다. 가트너의 업계 분석가들은 2027년까지 75%의 기업이 조직 전반에서 SRE 관행을 사용하여 운영을 최적화할 것으로 예상했습니다. 이 비율은 2022년 SRE 관행을 사용하고 있는 기업의 10%에 불과한 큰 도약입니다. 

기업이 애플리케이션과 서비스를 온라인으로 이동함에 따라, 고객들은 다운타임이나 지연 없이 서비스에 원활하게 액세스할 수 있기를 기대합니다. SRE는 이러한 기대치를 달성하는 데 중요한 부분입니다. 특히 다운타임이 기술, 헬스케어 및 금융과 같은 심각한 영향을 미칠 수 있는 산업에서 그렇습니다. 

글로벌 대기업은 서비스 및 애플리케이션의 안정성을 보장하기 위해 SRE 기술을 갖춘 엔지니어가 필요합니다. 이 역할에는 많은 기술적 요구 사항이 있지만, SRE 경력 트랙은 광범위하게 개방되어 있어 추가적인 관리 및 리더십 역할로 이어질 수 있습니다.

연락처
질문하기

퓨어스토리지 제품이나 인증 관련 질문이나 코멘트가 있으신가요?   저희가 도와드립니다.

데모 예약

라이브 데모를 예약하고 퓨어스토리지가 데이터를 어떻게 강력한 결과로 전환해주는지 직접 확인해 보세요. 

연락하기: +82 2 6001-3330

언론홍보팀:  pr@purestorage.com

 

퓨어스토리지코리아 주소

30F 아셈타워,

517 영동대로,

강남구, 서울

대한민국

korea@purestorage.com

닫기
지원하지 않는 브라우저입니다.

오래된 브라우저는 보안상 위험을 초래할 수 있습니다. 최상의 경험을 위해서는 다음과 같은 최신 브라우저로 업데이트하세요.