업계 테스트 및 공급업체 사양에 따르면, 원시 NAND 플래시 읽기에는 약 100마이크로초가 소요됩니다. 그러나 SATA SSD는 일반적으로 총 100~200마이크로초의 레이턴시를 제공하는 반면, NVMe SSD는 20~100마이크로초의 레이턴시를 달성하여 프로토콜 오버헤드가 실제 미디어 액세스 시간과 같거나 초과될 수 있음을 보여줍니다. NVMe
IOPS 및 실제 영향
단일 NVMe 장치는 수십 개의 SATA SSD가 필요한 성능인 4KB 랜덤 읽기에 1백만 개 이상의 IOPS를 제공할 수 있습니다. 엔드-투-엔드 NVMe의 Oracle 데이터베이스는 다음을 보여줍니다.
- 초당 더 많은 트랜잭션
- 쿼리 응답 시간 단축
- 스토리지 관련 대기 이벤트 감소
전력 효율성
NVMe의 효율성은 성능의 이점을 제공합니다. 프로토콜 오버헤드 제거:
- SATA SSD: 와트당 ~10,000 IOPS
- NVMe SSD: 와트당 최대 50,000 IOPS
NVMe-oF: NVMe를 직접 연결 이상으로 확장
NVMe over Fabrics는 NVMe NVMe 의 이점을 데이터센터 전반에 걸쳐 확장하여, 지연 시간 이점을 희생하지 않고 공유 스토리지를 지원합니다. 그러나 구현 옵션은 성능에 큰 영향을 미칩니다.
NVMe over fibre channel(FC-NVMe)
FC-NVMe은 기존 SAN 인프라를 활용하여 fibre channel에 투자하는 기업들에게 매력적입니다. NVMe 포워딩을 지원하는 5세대(16Gb) 또는 6세대(32Gb) 스위치가 필요합니다. 'NVMe 지원'이라고 주장하는 구형 스위치는 종종 프로토콜 변환을 수행하여 오버헤드를 재도입합니다.
RoCE 기반의 NVMe
RoCE는 커널 바이패스를 통해 네트워크 레이턴시가 가장 낮을 것을 약속합니다. 즉, RDMA 운영은 약 1마이크로초 안에 완료됩니다. 그러나 RoCE는 모든 스위치와 어댑터에서 우선적인 흐름 제어를 통해 무손실 이더넷을 요구합니다. 잘못 구성된 포트 1개는 성능이 저하될 수 있습니다. 사실, 많은 'RoCE' 구축이 실제로 iWARP를 실행하는데, 이는 실제 RoCE가 너무 취약하기 때문입니다. 적절하게 구현되면 RoCE는 160~180마이크로초의 스토리지 지연 시간을 제공할 수 있습니다.
TCP 통한 NVMe
NVMe/TCP는 특수 하드웨어 없이 표준 이더넷을 통해 실행됩니다. 크리티컬한 환경에서는 네트워크 전반에 걸쳐 SATA SSD보다 200~250마이크로세컨드 레이턴시 달성할 수 있습니다.
주요 장점은 단순성입니다. NVMe/TCP는 기존 스위치, 표준 NIC 및 클라우드 공급업체 네트워크와 호환됩니다.
프로덕션 환경에서 NVMe 구현
NVMe 드라이브를 설치하기만 하면 기대되는 이점을 거의 제공하지 않습니다. 전체 스토리지 스택은 엔드-투-엔드 NVMe 운영을 지원해야 합니다.
프로토콜 번역 트랩
많은 조직들이 기존 어레이를 위해 NVMe SSD를 구매하고 혁신을 기대합니다. 드라이브는 NVMe를 통해 통신하지만, 컨트롤러는 호환성을 위해 모든 것을 SCSI로 변환합니다. 이 번역은 마이크로초를 추가하여 NVMe의 이점을 떨어뜨립니다.
OS 및 마이그레이션 요구 사항
NVMe를 지원하려면 현대적인 Operating System가 필요합니다. 각 모듈에는 친화성, 다중 경로 모듈 및 대기열 깊이 조정을 중단시키는 특정 구성이 필요합니다.
성공적인 마이그레이션을 위해:
- 검증을 위해 중요하지 않은 워크로드부터 시작하세요
- 모든 계층에서 레이턴시 모니터링 구현
- 지연 시간에 민감한 데이터베이스의 우선 순위 지정
- nvme-cli와 같은 툴로 엔드-투-엔드 NVMe 검증
AI 및 현대적인 워크로드를 위한 NVMe
고가의 GPU는 종종 유휴 상태로 유지되어 데이터를 기다립니다. NVMe는 GPU 다이렉트 스토리지를 통해 데이터를 GPU 메모리로 직접 전송할 수 있도록 지원합니다.
AI 트레이닝의 의미:
- 더 빠른 에폭 교육
- 더 빠른 체크포인트 쓰기
- GPU 활용률 향상
- 전처리를 위해 CPU 확보
데이터베이스는 원시 속도 이상의 이점을 제공합니다. NVMe의 예측 가능한 200마이크로초 미만의 레이턴시는 쿼리 계획의 불확실성을 제거합니다. 옵티마이저는 데이터가 빠르게 도착하여 더 나은 결정을 내립니다. 느린 스토리지를 위해 설계된 애플리케이션은 스토리지를 예측할 수 있을 때 다르게 작동합니다.
퓨어스토리지의 엔드-투-엔드 NVMe의 장점
퓨어스토리지 퓨어스토리지 는 업계에서 채택 전략에 대해 논의하는 동안 수천 건의 고객 구축에 엔드-투-엔드 NVMe를 구축하여 실제 작동 방식을 보여주는 원격 측정을 구현했습니다. 차별화 요소는 애플리케이션과 NAND 플래시 간의 모든 프로토콜 변환을 제거하는 것입니다.
다이렉트플래시(DirectFlash): 숨겨진 오버헤드 제거
기존 NVMe SSD에는 이중화 컨트롤러와 오버프로비저닝이 포함되어 있습니다. 퓨어스토리지® DirectFlash® 모듈은 원시 NAND를 어레이의 NVMe 인터페이스에 직접 노출시켜 다음을 제공합니다.
- 더 많은 용량 사용
- 낮은 전력 소비
- 가비지 수집 없이 예측 가능한 지연 시간
- 올플래시 전반에 걸친 글로벌 웨어 레벨링
엔드-투-엔드 NVMe 아키텍처
Purity 소프트웨어는 레거시 시스템을 지원하면서 호스트에서 NAND까지 NVMe를 유지합니다. NVMe 호스트의 경우 네임스페이스에 직접 액세스할 수 있습니다. 레거시 호스트의 경우 내부가 아닌 어레이 엣지에서 한 번 번역됩니다.
퓨어스토리지 FlashArray//X™는 내부 프로토콜 변환을 제거하여 200마이크로초 미만의 일관된 지연 시간을 제공합니다.
- 퓨어스토리지 어레이: 평균 150μs의 레이턴시
- 내부 변환을 지원하는 기존 'NVMe' 어레이: 400~600μs
- 차이점: 프로토콜 번역 오버헤드 제거
무중단 진화
퓨어스토리지 에Evergreen 아키텍처 는 업그레이드 없이 NVMe를 도입할 수 있도록 지원합니다. 컨트롤러는 데이터 마이그레이션 없이 NVMe 지원 버전으로 업그레이드됩니다.
NVMe의 미래
NVMe의 진화는 속도를 넘어 확장됩니다. NVMe 2.0 사양은 스토리지 장치 자체 내에서 전산 스토리지 처리를 도입합니다. 데이터베이스 필터링, 압축 및 AI 추론은 데이터가 존재하는 곳에서 발생하므로 이동 오버헤드가 제거됩니다.
결론
NVMe는 수십 년 동안 애플리케이션을 제약하는 인공적인 병목 현상을 없애줍니다. 프로토콜 변환 없이 엔드-투-엔드 방식으로 구현되는 NVMe는 데이터베이스 트랜잭션에서 AI 트레이닝까지 모든 것을 변환하는 150마이크로세컨드 레이턴시를 제공합니다.
중요한 인사이트: 프로토콜 번역은 NVMe의 장점을 파괴합니다. NVMe-oF는 데이터센터 전반에 걸쳐 이점을 제공하지만 구현은 중요합니다. 현대적 워크로드는 엔드-투-엔드 NVMe만이 제공하는 예측 가능하고 낮은 레이턴시를 필요로 합니다.
수천 명의 고객들을 대상으로 검증을 거친 퓨어스토리지의 엔드-투-엔드 구현은 150마이크로세컨드 레이턴시가 운영의 현실임을 입증합니다. 다이 DirectFlash 모듈을 통해 조직은 NVMe의 성능을 약속합니다. 퓨어스토리지 퓨어스토리지 Evergreen 아키텍처는 스토리지가 컴퓨팅 기능과 메모리 속도로 진화함에 따라 오늘날의 투자가 중단 없이 미래의 혁신을 이루도록 보장합니다.