Skip to Content

NVMe란? Non-Volatile Memory Express에 대한 전체 가이드

기계식 드라이브용으로 설계된 스토리지 프로토콜은 10년 이상 플래시 성능을 제한해 왔습니다. SSD는 마이크로초급 하드웨어를 제공하지만 SATA 및 SAS와 같은 레거시 프로토콜은 업계 벤치마크 및 실제 배포를 기반으로 단일 대기열 아키텍처 및 프로토콜 변환 계층을 통해 수백 마이크로초의 불필요한 지연 시간을 추가합니다.

NVMe(Non-Volatile Memory Express)는 PCIe 인터페이스를 통해 직접 연결되는 솔리드 스테이트 드라이브 위해 특별히 설계된 스토리지 프로토콜로, 디스크 시대 프로토콜의 병목 현상을 제거합니다. NVMe는 SATA와 같은 단일 큐를 통해 명령을 퍼널링하는 대신, 각각 64,000개의 명령으로 최대 64,000개의 큐를 지원하여 스토리지가 최신 멀티 코어 프로세서와 통신하는 방식을 근본적으로 변화시킵니다.

그러나 대부분의 논의에서 놓치는 것은 시스템이 프로토콜 간에 여전히 변환되고, NVMe를 SCSI로 변환한 후 데이터 경로의 다양한 지점에서 다시 돌아오는 경우 NVMe 드라이브를 추가하는 것만으로는 충분하지 않다는 점입니다.

이 가이드는 NVMe의 아키텍처를 살펴보고, 실제 성능의 이점을 정량화하며, 엔드-투-엔드 NVMe 구현이 중요한 이유를 설명합니다.

NVMe가 스토리지 아키텍처를 혁신시킨 방법

20년 동안 스토리지 프로토콜은 기계적 한계를 중심으로 설계되었습니다. SATA와 SAS는 디스크 플래터가 제자리로 회전해야 할 때 타당한 명령 오버헤드를 구축하여 데이터를 물리적으로 찾는 데 시간이 필요하다고 가정했습니다. 이러한 프로토콜은 기계적 탐색에는 적합하지만 마이크로초 응답이 가능한 플래시 메모리에는 치명적입니다.

숫자에서 프로토콜 불일치가 명확해집니다. SAS는 단일 대기열에서 최대 256개의 명령(SAS-3 사양에 따라)을 지원하며 엔터프라이즈 SSD는 수천 개의 동시 작업을 처리합니다. 이러한 레거시 프로토콜에는 여러 개의 변환 레이어가 필요합니다. 애플리케이션은 NVMe 명령을 전송하여 SCSI, SATA 또는 SAS로 변환한 다음, 드라이브 수준에서 NVMe로 되돌립니다. 각 변환은 50~200마이크로초의 지연 시간을 추가합니다.

플래시에 자체 프로토콜이 필요한 이유

NVMe는 2011년 번역 페널티를 없애기 위해 등장했습니다. NVM Express 컨소시엄은 디스크 프로토콜을 개조하는 대신 기계적 구성 요소가 없다고 가정하는 프로토콜을 설계했습니다. NVMe는 명령 세트를 간소화하여 오버헤드 구문 분석을 제거하는 동시에 전체 기능을 유지합니다.

프로토콜은 그래픽 카드에 사용되는 것과 동일한 고속 인터페이스인 PCIe 레인을 통해 스토리지를 CPU에 직접 연결합니다. 이를 통해 스토리지는 다른 고성능 컴포넌트에 대한 피어로 자리매김하며, 번역 계층 뒤에 위임하지 않습니다. 64GB/s의 대역폭을 제공하는 PCIe Gen 4를 통해 NVMe는 플래시가 제약 없이 작동할 수 있도록 합니다.

NVMe의 작동 방식: 아키텍처 및 컴포넌트

NVMe의 아키텍처는 스토리지 통신을 근본적으로 재고합니다. NVMe 스토리지는 기존 호스트 버스 어댑터 대신 메모리 매핑 I/O로 CPU에 나타나 커널 오버헤드 없이 직접 액세스할 수 있습니다.

대기열 아키텍처 및 CPU 최적화

현대적인 프로세서에는 수십 개의 코어가 포함되어 있지만, 레거시 스토리지 프로토콜은 단일 I/O 큐를 통해 모든 코어를 퍼널링합니다. NVMe는 각 CPU 코어에 전용 큐 쌍을 할당하여 잠금 경합을 제거하고 진정한 병렬 처리를 지원합니다.

애플리케이션이 데이터를 필요로 할 때, 간단한 메모리 쓰기를 통해 제출 대기열에 명령을 내리므로 시스템 호출이 필요하지 않습니다. NVMe 컨트롤러는 독립적으로 명령을 처리하고 결과를 완료 대기열로 만듭니다. 이 비동기 모델은 CPU가 스토리지를 기다리는 사이클을 거의 소비하지 않는다는 것을 의미합니다.

PCIe 레인 및 대역폭

NVMe 디바이스는 PCIe 레인을 통해 연결되며, 각 레인은 양방향 대역폭을 제공합니다. 일반적인 NVMe SSD는 PCIe Gen 4를 통해 최대 8GB/s를 제공하는 4개의 PCIe 레인을 사용합니다. 8GB PCIe 엔터프라이즈 어레이는 여러 디바이스를 통합하여 처리량을 향상시킵니다.

그러나 대역폭만으로는 성능을 결정할 수 없습니다. 요청과 응답 사이의 시간인 레이턴시는 트랜잭션 워크로드에 더 중요합니다. NVMe의 직접 PCIe 연결은 SATA 구현을 방해하는 여러 버스 전환 및 프로토콜 변환을 제거합니다.

NVMe 성능의 장점: 마케팅이 아닌 실제 수치

스토리지 산업 마케팅은 종종 '엄청나게 빠른 속도' 또는 '초대응형'과 같은 모호한 주장을 합니다. 그러나 NVMe는 진정한 이점을 제공합니다.

레이턴시: 마이크로초의 현실

스토리지 프로토콜

일반적인 레이턴시

프로토콜 오버헤드

SATA SSD

100~200 μs

50~100 μs

NVMe 다이렉트

20~100 μs

<10 μs

퓨어스토리지 엔드-투-엔드 NVMe

150 μs

0 μs

Slide

업계 테스트 공급업체 사양에 따르면, 원시 NAND 플래시 읽기에는 약 100마이크로초가 소요됩니다. 그러나 SATA SSD는 일반적으로 총 100~200마이크로초의 레이턴시를 제공하는 반면, NVMe SSD는 20~100마이크로초의 레이턴시를 달성하여 프로토콜 오버헤드가 실제 미디어 액세스 시간과 같거나 초과될 수 있음을 보여줍니다. NVMe

IOPS 및 실제 영향

단일 NVMe 장치는 수십 개의 SATA SSD가 필요한 성능인 4KB 랜덤 읽기에 1백만 개 이상의 IOPS를 제공할 수 있습니다. 엔드-투-엔드 NVMe의 Oracle 데이터베이스는 다음을 보여줍니다.

  • 초당 더 많은 트랜잭션
  • 쿼리 응답 시간 단축
  • 스토리지 관련 대기 이벤트 감소

전력 효율성

NVMe의 효율성은 성능의 이점을 제공합니다. 프로토콜 오버헤드 제거:

  • SATA SSD: 와트당 ~10,000 IOPS
  • NVMe SSD: 와트당 최대 50,000 IOPS

NVMe-oF: NVMe를 직접 연결 이상으로 확장

NVMe over Fabrics는 NVMe NVMe 의 이점을 데이터센터 전반에 걸쳐 확장하여, 지연 시간 이점을 희생하지 않고 공유 스토리지를 지원합니다. 그러나 구현 옵션은 성능에 큰 영향을 미칩니다.

NVMe over fibre channel(FC-NVMe)

FC-NVMe은 기존 SAN 인프라를 활용하여 fibre channel에 투자하는 기업들에게 매력적입니다. NVMe 포워딩을 지원하는 5세대(16Gb) 또는 6세대(32Gb) 스위치가 필요합니다. 'NVMe 지원'이라고 주장하는 구형 스위치는 종종 프로토콜 변환을 수행하여 오버헤드를 재도입합니다.

RoCE 기반의 NVMe

RoCE는 커널 바이패스를 통해 네트워크 레이턴시가 가장 낮을 것을 약속합니다. 즉, RDMA 운영은 약 1마이크로초 안에 완료됩니다. 그러나 RoCE는 모든 스위치와 어댑터에서 우선적인 흐름 제어를 통해 무손실 이더넷을 요구합니다. 잘못 구성된 포트 1개는 성능이 저하될 수 있습니다. 사실, 많은 'RoCE' 구축이 실제로 iWARP를 실행하는데, 이는 실제 RoCE가 너무 취약하기 때문입니다. 적절하게 구현되면 RoCE는 160~180마이크로초의 스토리지 지연 시간을 제공할 수 있습니다.

TCP 통한 NVMe

NVMe/TCP는 특수 하드웨어 없이 표준 이더넷을 통해 실행됩니다. 크리티컬한 환경에서는 네트워크 전반에 걸쳐 SATA SSD보다 200~250마이크로세컨드 레이턴시 달성할 수 있습니다.

주요 장점은 단순성입니다. NVMe/TCP는 기존 스위치, 표준 NIC 및 클라우드 공급업체 네트워크와 호환됩니다.

프로덕션 환경에서 NVMe 구현

NVMe 드라이브를 설치하기만 하면 기대되는 이점을 거의 제공하지 않습니다. 전체 스토리지 스택은 엔드-투-엔드 NVMe 운영을 지원해야 합니다.

프로토콜 번역 트랩

많은 조직들이 기존 어레이를 위해 NVMe SSD를 구매하고 혁신을 기대합니다. 드라이브는 NVMe를 통해 통신하지만, 컨트롤러는 호환성을 위해 모든 것을 SCSI로 변환합니다. 이 번역은 마이크로초를 추가하여 NVMe의 이점을 떨어뜨립니다.

OS 및 마이그레이션 요구 사항

NVMe를 지원하려면 현대적인 Operating System가 필요합니다. 각 모듈에는 친화성, 다중 경로 모듈 및 대기열 깊이 조정을 중단시키는 특정 구성이 필요합니다.

성공적인 마이그레이션을 위해:

  1. 검증을 위해 중요하지 않은 워크로드부터 시작하세요
  2. 모든 계층에서 레이턴시 모니터링 구현
  3. 지연 시간에 민감한 데이터베이스의 우선 순위 지정
  4. nvme-cli와 같은 툴로 엔드-투-엔드 NVMe 검증

AI 및 현대적인 워크로드를 위한 NVMe

고가의 GPU는 종종 유휴 상태로 유지되어 데이터를 기다립니다. NVMe는 GPU 다이렉트 스토리지를 통해 데이터를 GPU 메모리로 직접 전송할 수 있도록 지원합니다.

AI 트레이닝의 의미:

  • 더 빠른 에폭 교육
  • 더 빠른 체크포인트 쓰기
  • GPU 활용률 향상 
  • 전처리를 위해 CPU 확보

데이터베이스는 원시 속도 이상의 이점을 제공합니다. NVMe의 예측 가능한 200마이크로초 미만의 레이턴시는 쿼리 계획의 불확실성을 제거합니다. 옵티마이저는 데이터가 빠르게 도착하여 더 나은 결정을 내립니다. 느린 스토리지를 위해 설계된 애플리케이션은 스토리지를 예측할 수 있을 때 다르게 작동합니다.

퓨어스토리지의 엔드-투-엔드 NVMe의 장점

퓨어스토리지 퓨어스토리지 는 업계에서 채택 전략에 대해 논의하는 동안 수천 건의 고객 구축에 엔드-투-엔드 NVMe를 구축하여 실제 작동 방식을 보여주는 원격 측정을 구현했습니다. 차별화 요소는 애플리케이션과 NAND 플래시 간의 모든 프로토콜 변환을 제거하는 것입니다.

다이렉트플래시(DirectFlash):  숨겨진 오버헤드 제거

기존 NVMe SSD에는 이중화 컨트롤러와 오버프로비저닝이 포함되어 있습니다. 퓨어스토리지® DirectFlash® 모듈은 원시 NAND를 어레이의 NVMe 인터페이스에 직접 노출시켜 다음을 제공합니다.

  • 더 많은 용량 사용
  • 낮은 전력 소비
  • 가비지 수집 없이 예측 가능한 지연 시간
  • 올플래시 전반에 걸친 글로벌 웨어 레벨링

엔드-투-엔드 NVMe 아키텍처

Purity 소프트웨어는 레거시 시스템을 지원하면서 호스트에서 NAND까지 NVMe를 유지합니다. NVMe 호스트의 경우 네임스페이스에 직접 액세스할 수 있습니다. 레거시 호스트의 경우 내부가 아닌 어레이 엣지에서 한 번 번역됩니다.

퓨어스토리지 FlashArray//X™는 내부 프로토콜 변환을 제거하여 200마이크로초 미만의 일관된 지연 시간을 제공합니다.

  • 퓨어스토리지 어레이: 평균 150μs의 레이턴시
  • 내부 변환을 지원하는 기존 'NVMe' 어레이: 400~600μs
  • 차이점: 프로토콜 번역 오버헤드 제거

무중단 진화

퓨어스토리지 에Evergreen 아키텍처 는 업그레이드 없이 NVMe를 도입할 수 있도록 지원합니다. 컨트롤러는 데이터 마이그레이션 없이 NVMe 지원 버전으로 업그레이드됩니다.

NVMe의 미래

NVMe의 진화는 속도를 넘어 확장됩니다. NVMe 2.0 사양은 스토리지 장치 자체 내에서 전산 스토리지 처리를  도입합니다. 데이터베이스 필터링, 압축 및 AI 추론은 데이터가 존재하는 곳에서 발생하므로 이동 오버헤드가 제거됩니다.

결론

NVMe는 수십 년 동안 애플리케이션을 제약하는 인공적인 병목 현상을 없애줍니다. 프로토콜 변환 없이 엔드-투-엔드 방식으로 구현되는 NVMe는 데이터베이스 트랜잭션에서 AI 트레이닝까지 모든 것을 변환하는 150마이크로세컨드 레이턴시를 제공합니다.

중요한 인사이트: 프로토콜 번역은 NVMe의 장점을 파괴합니다. NVMe-oF는 데이터센터 전반에 걸쳐 이점을 제공하지만 구현은 중요합니다. 현대적 워크로드는 엔드-투-엔드 NVMe만이 제공하는 예측 가능하고 낮은 레이턴시를 필요로 합니다.

수천 명의 고객들을 대상으로 검증을 거친 퓨어스토리지의 엔드-투-엔드 구현은 150마이크로세컨드 레이턴시가 운영의 현실임을 입증합니다. 다이 DirectFlash  모듈을 통해 조직은 NVMe의 성능을 약속합니다. 퓨어스토리지 퓨어스토리지 Evergreen  아키텍처는 스토리지가 컴퓨팅 기능과 메모리 속도로 진화함에 따라 오늘날의 투자가 중단 없이 미래의 혁신을 이루도록 보장합니다.

플래시어레이//X (FlashArray//X) 무료 체험 하기

셀프 서비스 환경에서 퓨어의 플래시어레이//X (FlashArray//X)를 관리할 수 있습니다. 스냅샷, 복제, ActiveCluster™는 물론 VMware 통합까지 다양한 고급 기능을 활용할 수 있습니다.

무료 체험 신청하기

다음을 추천드립니다.

11/2025
FlashBlade Data Protection with Rubrik
Rubrik and Pure Storage have partnered to provide an integrated, performant, and simple-to-manage solution that will enable IT professionals to seamlessly protect and restore content for the Pure Storage FlashBlade™ array.
백서
28 pages

주요 유용한 자료 및 이벤트를 확인하세요

THOUGHT LEADERSHIP
혁신을 향한 레이스

스토리지 혁신의 최전선에 있는 업계 리더들의 최신 인사이트 및 관점을 확인하세요.

더 알아보기
동영상
동영상 시청: 엔터프라이즈 데이터 클라우드의 가치

찰스 쟌칼로(Charles Giancarlo) CEO가 전하는 스토리지가 아닌 데이터 관리가 미래인 이유 통합 접근 방식이 기업 IT 운영을 어떻게 혁신하는지 알아보세요

지금 시청하기
유용한 자료
레거시 스토리지는 미래를 지원할 수 없습니다.

현대적 워크로드에는 AI 지원 속도, 보안, 확장성이 필수입니다. 귀사의 IT 스택, 준비됐나요?

지금 확인하기
퓨어360(PURE260) 데모
퓨어스토리지를 직접 탐색하고, 배우고, 경험해보세요.

퓨어스토리지의 역량을 확인할 수 있는 온디맨드 비디오와 데모를 시청하세요.

데모영상 시청하기
지원하지 않는 브라우저입니다.

오래된 브라우저는 보안상 위험을 초래할 수 있습니다. 최상의 경험을 위해서는 다음과 같은 최신 브라우저로 업데이트하세요.