Skip to Content

¿Qué es DirectFlash y cómo funciona?

collage speed highway and railways in communication supercomputer with binary code; Shutterstock ID 400031566; purchase_order: 0; job: ; client: ; other: Per Eric C request 11/7

Pure Storage ® DirectFlash ® es una solución pionera de administración de flash que incluye el software Purity y los módulos DirectFlash, ambos componentes que se pueden actualizar de forma independiente y sin interrupciones.

Así funciona, por qué es diferente y por qué lo necesita.

Descripción general del almacenamiento flash

La memoria flash, inventada por Toshiba en 1980, también conocida como almacenamiento flash, es un tipo de memoria no volátil (lo que significa que no requiere una fuente de alimentación continua) que se puede borrar y reprogramar electrónicamente.

Los dos tipos principales de memoria flash

Hay dos tipos principales de memoria flash, NOR y NAND, que difieren a nivel de circuito según el tipo de puerta lógica que estén usando. Actualmente, el flash NAND representa más del 95 % del mercado de memorias flash y se utiliza en casi todos los dispositivos flash no incorporados.

Dentro de la categoría NAND, hay varios tipos de memoria, clasificados en función de la cantidad de bits almacenados por celda de memoria, entre ellos:

  • SLC: Un bit (único) por celda
  • MLC: Dos (o varios) bits por celda
  • TLC: Tres bits por celda
  • QLC: Cuatro bits (cuadrados) por celda

¿Qué es el almacenamiento del módulo DirectFlash (DFM)?

DirectFlash es un módulo flash diseñado por Pure Storage que permite que las matrices basadas íntegramente en tecnología flash se comuniquen directamente con el almacenamiento flash en bruto. El enfoque holístico de Pure Storage para desarrollar sistemas basados íntegramente en tecnología flash implica aprovechar flash “sin procesar” para desarrollar nuestros módulos DirectFlash, en lugar de confiar en la compra de unidades de estado sólido (SSD) de productos básicos. Al hacer esto, obtenemos nuestro flash en un punto diferente en la cadena de suministro de otros proveedores de matrices de estado sólido. Pero los beneficios de DirectFlash son mucho más que solo una mejor economía de la cadena de suministro.

Otras matrices híbridas o basadas íntegramente en tecnología flash que utilizan SSD estándar de productos básicos hablan con sus unidades flash de la misma manera que lo harían con un disco duro heredado: como un conjunto contiguo de bloques idénticos.

Los discos duros tenían pistas y sectores, y colocar todos esos sectores de principio a fin era la forma en que se obtuvo una larga lista de bloques. Las SSD replican esta misma geometría al integrar sistemas complejos entre el sistema y el flash, llamado capa de traducción flash (FTL).

DirectFlash utiliza un enfoque diferente que habla directamente sobre la memoria flash, lo que maximiza las capacidades de flash y proporciona un mejor rendimiento, utilización de la energía y eficiencia.

Específicamente, DirectFlash ofrece:

  • Administración de medios a nivel del sistema, a diferencia del nivel de la unidad, lo que significa que las unidades funcionan en conjunto con el sistema en sí, lo que permite que el sistema:
    • Tome decisiones de ubicación de datos más inteligentes basadas en un contexto más amplio.
    • Comprenda la actividad del sistema desde el nivel de bloque, archivo u objeto hasta una celda flash individual.    
    • Maximice la eficiencia mediante la distribución de datos de maneras optimizadas para los medios, evitando la amplificación de la escritura y aumentando la resistencia.
    • Evite el trabajo duplicado centralizando funciones como la recolección de basura, la conservación y la nivelación de desgaste.
  • Reducción de los costos generales de medios al eliminar los esfuerzos y procesos duplicados que ocurren en cada unidad en un sistema tradicional. Los sistemas a escala de petabytes que aprovechan las SSD pueden tener terabytes de DRAM en las unidades mismas, ni siquiera en la memoria del sistema, para mantener sus mapeos de FTL y metadatos individuales. Cada unidad también contiene su propio espacio libre sobreaprovisionado que es necesario para la administración de medios por parte del FTL. Cada uno de estos componentes representa un costo adicional que, a medida que aumentan los tamaños de las unidades, representará una parte cada vez mayor del costo total de los medios. El costo por bit de DRAM no ha mejorado en los últimos años, por lo que el uso eficiente de DRAM se volverá cada vez más crítico.
  • Mayor confiabilidad del módulo al fallar a una tasa mucho más baja (tres o cuatro veces) en comparación con las SSD, principalmente debido a la ejecución más simple del firmware.

Descubra cómo los módulos DirectFlash impulsan la eficiencia: La infraestructura de TI eficiente ahorra más que solo costos de energía

Cómo funcionan las unidades de estado sólido

Una SSD está compuesta por chips flash NAND, también conocidos como troqueles flash NAND, y cada troquel se divide en elementos más pequeños llamados bloques, que están compuestos por páginas.

Sin embargo, los bloques flash no admiten sobrescrituras aleatorias. Una vez que se escribe una página con datos, se debe borrar todo el bloque antes de que se puedan escribir nuevos datos. Al mismo tiempo, cada SSD está diseñado para admitir una interfaz del sector de discos compatible con versiones anteriores.

¿Qué es la capa de traducción flash (FTL)?

Esta contradicción se resuelve al tener algo en el firmware conocido como “capa de traducción flash” o FTL, que implementa una interfaz del sector de discos virtuales que le permite escribir datos en diferentes páginas flash, independientemente del bloque lógico para el que se destinaron los datos. FTL lleva un registro de todos estos metadatos de mapeo en su propia memoria y almacenamiento de metadatos.

Pero, debido a que ahora está escribiendo nuevas versiones de datos en diferentes páginas flash, eventualmente acumula datos en esos bloques que podrían considerarse “basura” porque los datos han sido sobrescritos o eliminados lógicamente.

Cómo funciona la recolección de basura en SSD

Para recuperar esta capacidad física, un proceso de “recopilador de basura” en el firmware de la unidad toma los datos que aún son válidos y los mueve a una nueva ubicación para que luego pueda borrar todo el bloque que contiene los datos “detonados”. Para que este colector de basura funcione, cada unidad necesita memoria flash adicional, lo que se conoce como “espacio sobreaprovisionado”, y cada evento de recolección de basura consume uno de los números finitos de ciclos de borrado/programa flash. La cantidad de escrituras físicas en la unidad que consume cada escritura lógica se conoce como “amplificación de la escritura”.

El sobreaprovisionamiento y la amplificación de la escritura provocan un desgaste prematuro y una vida útil más corta del SSD. También hay impactos en el rendimiento de este diseño porque cada vez que uno de estos troqueles flash realiza la recolección de basura, las lecturas o escrituras no estarán disponibles a partir de ese troquel. Por lo tanto, el rendimiento de la SSD fluctúa de manera impredecible a medida que el recopilador de basura se vuelve más o menos activo.

Lo que hace que esto sea aún más desafiante es que las SSD no tienen forma de comunicar esta actividad de recolección de basura al sistema al que acceden. Más bien, el SSD tiene que mantener la ilusión de que es como un disco duro. A medida que aumenta la cantidad de bits por celda en flash NAND, estas inconsistencias de rendimiento solo empeoran, ya que los ciclos de programa/borrado tardan cada vez más, lo que lleva a períodos más largos de inaccesibilidad de datos.

Las ventajas de usar DirectFlash

DirectFlash adopta un enfoque diferente para la administración de medios flash. En lugar de desaprovisionar cada SSD para que realice su propio nivelación de desgaste, recolección de basura y sobreaprovisionamiento, el sistema operativo Purity realiza estas funciones en software a nivel de matriz. Esto significa que cada módulo DirectFlash es más simple que un disco de estado sólido tradicional, ya que solo tiene que proporcionar acceso a los medios en sí y manejar tareas de señalización y datos de bajo nivel.

Obtenga más información sobre cómo DirectFlash pone fin a las unidades de disco duro (HDD).

Los beneficios que esto ofrece son numerosos:

  • Densidad y eficiencia mejoradas. Nuestros módulos DirectFlash (DFM) ofrecen una densidad de almacenamiento de dos a tres veces mejor y consumen de un 39 % a un 54 % menos de vatios por terabyte que nuestros competidores más cercanos en la actualidad. Los DFM de Pure Storage no emulan los HDD mecánicos, lo que permite que los medios flash basados en silicio se administren de manera óptima de una manera que mejora significativamente el rendimiento, la densidad de almacenamiento, la capacidad efectiva, la resistencia de los medios y el costo por TB utilizable en relación con los SSD COTS. Pure Storage está enviando DFM de 48TB hoy, agregará DFM de 75TB más adelante este año, agregará DFM de 150TB en un plazo de 18 meses y está planificando DFM de 300TB para 2026. Más información.
  • Colocación inteligente de datos. En lugar de que cada SSD tome decisiones sobre la colocación de datos y la administración de medios en un vacío, Purity conoce todas las tareas del sistema programadas y en curso, como la actividad de E/S actual, las operaciones de reducción de datos, los ciclos de recolección de basura pendientes y la carga de trabajo y el estado generales de la matriz. Esto permite que Purity tome decisiones de ubicación y programación mucho más inteligentes de lo que podría hacer una sola unidad por sí sola.
  • Al tomar decisiones de ubicación de datos más inteligentes, los datos de períodos de vida esperados similares pueden ubicarse conjuntamente en los mismos bloques para minimizar las instancias en las que algunos datos en bloques están “marcados con tormentas”, mientras que otras páginas siguen siendo válidas. Purity sabe si ciertas páginas forman parte del mismo archivo u objeto o provienen del mismo sistema host, por lo que al agrupar esas páginas en bloques similares cuando se elimina ese archivo u objeto, se puede liberar todo el bloque a la vez, sin volver a escribir otros datos en vivo y sin causar amplificación de la escritura.
  • Superan y duran más. Al no realizar recolección de basura y no causar amplificación de la escritura, los módulos DirectFlash superan y superan a sus contrapartes de productos básicos. Menos escrituras significa menos desgaste y, por lo tanto, una vida útil más prolongada. Menos escrituras también significa que hay más ciclos de E/S disponibles para prestar servicio a la E/S del cliente “real”. Y como Purity conoce la actividad actual de E/S y tiene visibilidad de todo el sistema, nunca se sorprende con uno de estos ciclos de programa/borrado que bloquea el acceso a los datos. En el peor de los casos, Purity puede simplemente reconstruir esos datos a partir de la paridad en lugar de esperar a que finalice un ciclo de programa/borrado. Esto reduce significativamente la latencia del peor caso de nuestros sistemas, incluso cuando se usa flash QLC.
  • Mejoran con el tiempo. Debido a que realizamos todas estas tareas de administración de medios en software, podemos mejorar este software con el tiempo. Todos los sistemas de Pure Storage conectados a Internet llaman de forma segura a los datos de telemetría doméstica y, dado que tenemos un conocimiento profundo sobre la salud y la actividad de la memoria flash subyacente, agregamos y analizamos estos datos para mejorar la forma en que funciona nuestro software en el mundo real. Esto significa que, con el tiempo, la confiabilidad y el rendimiento de nuestros sistemas pueden mejorar con actualizaciones de software regulares.
  • Son más simples y confiables. Debido a que realizamos todas estas actividades a nivel de matriz en software, nuestros módulos DirectFlash no necesitan controladores complejos y grandes cantidades de RAM para hacer todo este trabajo por su cuenta. Por lo tanto, nuestros módulos son más simples y, por lo tanto, más confiables, además de ser más eficientes. También podemos escalar el tamaño de nuestras unidades con avances en la tecnología de fabricación flash NAND, sin necesidad de aumentar la complejidad o el costo de las unidades.

Esto significa para los clientes sistemas que tienen más rendimiento, de manera más consistente y más confiabilidad y longevidad que otros sistemas híbridos o basados íntegramente en tecnología flash diseñados en torno a SSD.

Pure Storage se fundó en torno a la creencia de que el futuro del centro de datos era flash, y hemos desarrollado nuestra tecnología DirectFlash para hacer realidad esta visión. Creemos que la mejor manera de crear sistemas basados íntegramente en tecnología flash es construir el sistema desde cero para los sistemas basados íntegramente en tecnología flash. Eso significa eliminar las partes del sistema diseñadas en torno a interfaces y paradigmas heredados y permitir que la tecnología realmente brille.

¿Quiere aprovechar la tecnología DirectFlash en su centro de datos? Consulte nuestro paquete de soluciones de almacenamiento basado íntegramente en tecnología flash hoy mismo.

CONTÁCTENOS
¿Preguntas, comentarios?

¿Tiene alguna pregunta o comentario sobre los productos o las certificaciones de Pure?  Estamos aquí para ayudar.

Programe una demostración

Programe una demostración en vivo y compruebe usted mismo cómo Pure puede ayudarlo a transformar sus datos en potentes resultados. 

Llámenos: 800-976-6494

Medios de comunicación: pr@purestorage.com

 

Pure Storage, Inc.

2555 Augustine Dr.

Santa Clara, CA 95054

800-379-7873 (información general)

info@purestorage.com

CERRAR
¡Su navegador ya no es compatible!

Los navegadores más antiguos a menudo representan riesgos de seguridad. Para brindar la mejor experiencia posible al utilizar nuestro sitio, actualice a cualquiera de estos navegadores más recientes.