DirectFlash® est une solution de gestion du stockage flash révolutionnaire développée par Pure, qui intègre à la fois notre logiciel Purity et nos modules DirectFlash, et qui offre la possibilité de mettre à niveau l’ensemble de ses composants de manière indépendante et sans la moindre interruption.
Dans cet article, nous allons voir comment fonctionne cette solution et ce qui la distingue des offres concurrentes au point d’en faire une technologie incontournable.
La mémoire flash (également appelée « stockage flash ») a été inventée en 1980 par Toshiba. Il s’agit d’un type de mémoire non volatile (qui n’a pas besoin d’être alimentée en continu) qu’il est possible d’effacer et de reprogrammer électroniquement.
On distingue deux principaux types de mémoires flash, NOR et NAND, dont la différence se situe au niveau du circuit en fonction de la porte logique utilisée. La technologie flash NAND représente aujourd’hui plus de 95 % du marché des mémoires flash ; elle est utilisée dans la majorité des appareils flash non intégrés.
Cette catégorie englobe différents types de mémoires, lesquels sont classés en fonction du nombre de bits stockés par cellule de mémoire :
DirectFlash désigne l’approche globale adoptée par Pure Storage pour le développement de systèmes 100 % flash. Plutôt que d’acheter des disques de stockage flash (SSD) dans le commerce, nous utilisons le stockage « brut » pour la conception de nos modules DirectFlash. Cette approche nous permet de nous procurer du stockage flash à un niveau de la chaîne d’approvisionnement différent de celui habituellement utilisé par les autres fournisseurs de baies de stockage flash. Mais la technologie DirectFlash n’offre pas simplement des avantages économiques assurés par une meilleure chaîne d’approvisionnement.
Toutes les autres baies 100 % flash ou hybrides qui s’appuient sur des SSD standard disponibles dans le commerce communiquent avec leurs disques flash sensiblement de la même manière qu’avec un disque dur traditionnel : en les considérant comme un ensemble contigu de blocs identiques.
Les disques durs comportent des pistes et des secteurs qui, s’ils sont mis bout à bout, finissent par donner une longue liste de blocs. Les SSD s’inspirent de cette géométrie, mais en intégrant des systèmes complexes entre le système et le stockage flash, qui forment ce que l’on appelle une couche de traduction flash (FTL, Flash Translation Layer).
DirectFlash repose sur une approche différente, qui consiste à communiquer directement avec la mémoire flash de manière à optimiser les capacités du stockage flash, les performances, la consommation d’énergie et l’efficacité globale.
DirectFlash présente de nombreux atouts :
Un SSD se compose de puces flash NAND, également appelées matrices de mémoire flash NAND, dans lesquelles chaque matrice est divisée en petits éléments appelés « blocs », qui sont eux-mêmes constitués de pages.
Les blocs de mémoire flash ne prennent toutefois pas en charge les écrasements aléatoires. Une fois que des données sont écrites sur une page, l’ensemble du bloc doit être effacé pour pouvoir y réécrire de nouvelles données. Dans le même temps, chaque SSD est conçu pour prendre en charge une interface de secteurs de disques rétrocompatible.
Pour résoudre cette contradiction, une « couche de traduction flash » (FTL) est intégrée au niveau du firmware pour implémenter une interface de secteurs de disques virtuelle, qui permet d’écrire des données sur différentes pages de mémoire flash, quel que soit le bloc logique auquel étaient destinées les données. La FTL assure le suivi de toutes ces métadonnées de mappage dans sa propre mémoire et dans son propre espace de stockage de métadonnées.
Mais comme de nouvelles versions des données sont écrites sur des pages de mémoire flash différentes, de nombreuses données finissent par s’accumuler dans les blocs. Ces données peuvent être assimilées à des « déchets », car elles n’ont été ni écrasées, ni supprimées logiquement.
Pour récupérer cette capacité physique, on utilise un processus de « collecte de déchets » au niveau du firmware de disque. Ce processus consiste à prendre les données valides et à les déplacer vers un nouvel emplacement, de manière à pouvoir effacer l’intégralité du bloc qui contient les données « tombstone » (c’est-à-dire les données résiduelles). Pour que ce collecteur de déchets puisse fonctionner, chaque disque a besoin d’une mémoire flash supplémentaire, appelée « espace d’overprovisioning », et chaque événement de collecte de déchets consomme un nombre fini de cycles de programmation/d’effacement flash. On appelle « amplification en écriture » la quantité d’écritures physiques sur le disque que consomme chaque écriture logique.
L’overprovisioning et l’amplification en écriture entraînent une usure prématurée du SSD et réduisent sa durée de vie. Une telle conception nuit également aux performances car chaque fois qu’une matrice de mémoire flash lance un processus de collecte de déchets, aucune donnée de cette matrice n’est disponible en lecture ou en écriture. Les performances du SSD fluctuent donc de manière imprévisible selon que le collecteur de déchets est plus ou moins actif.
Pire encore, les SSD n’ont aucun moyen de communiquer cette activité de collecte de déchets au système qui y accède. Ils n’ont guère d’autre choix que de maintenir l’illusion de se comporter à la manière d’un disque dur. Et ces variations de performances ne font que s’accentuer à mesure que le nombre de bits par cellule augmente dans la mémoire flash NAND, puisque les cycles de programmation/d’effacement s’allongent, entraînant de plus longues périodes d’inaccessibilité des données.
DirectFlash adopte une approche différente de la gestion des supports de stockage flash. Plutôt que de confier à chaque SSD la charge d’effectuer ses propres opérations de contrôle de l’usure, de collecte de déchets et d’overprovisioning, le système d’exploitation Purity effectue ces fonctions dans un logiciel installé au niveau de la baie. Chaque module DirectFlash offre donc davantage de simplicité qu’un disque flash traditionnel car il lui suffit de fournir un accès au support lui-même et de gérer les données et tâches de signalisation de niveau secondaire.
Les avantages d’une telle approche sont nombreux :
Du point de vue du client, cet avantage se traduit par des systèmes plus performants et cohérents, qui offrent une fiabilité et une longévité incomparables à celles des autres systèmes 100 % flash ou hybrides conçus autour de la technologie SSD.
Toute la philosophie de Pure repose sur la conviction que la technologie 100 % flash est l’avenir du datacenter, et c’est dans cette logique que nous avons développé notre technologie DirectFlash. Nous sommes convaincus que le meilleur moyen de concevoir des systèmes 100 % flash consiste à développer intégralement le système autour de cette technologie, ce qui suppose de renoncer aux composants conçus autour d’interfaces et de modèles traditionnels pour révéler pleinement le potentiel de cette technologie innovante.
Vous avez des questions ou des commentaires concernant des produits ou certifications Pure ? Nous sommes là pour vous aider.
Planifiez une démo en direct et découvrez comment Pure peut vous aider à transformer vos données.
Tél. : +33 1 89 96 04 00
Services Médias : pr@purestorage.com
Pure Storage France
32 rue Guersant
75017 Paris