Connect with us

Technologie

RAID, codage flash et effacement : qu’est-ce qui fonctionne le mieux avec l’état solide ?

Published

on


Les systèmes RAID sont les éléments constitutifs du stockage d’entreprise depuis les années 1990.
Mais RAID – tableau redondant de disques bon marché – est né la décennie précédente dans la recherche de l’Université de Californie, Berkeley.

Des chercheurs de Berkeley ont été les pionniers de l’utilisation de lecteurs informatiques personnels à faible coût pour des données critiques. En combinant les disques dans un tableau, ils ont surmonté les limitations de vitesse et de fiabilité des disques durs PC, et les ont rapprochés des performances des disques mainframe beaucoup plus coûteux.

Depuis trois décennies, le disque raid offre la plupart du stockage aux serveurs, aux sauvegardes et aux archivages, et même à l’informatique en nuage. Mais avec la baisse des coûts du stockage flash et la capacité croissante, raid est-il toujours d’actualité ?

De plus en plus, les fournisseurs ont développé des niveaux RAID plus complexes en fonction des supports SSD, tandis que d’autres protocoles de protection des données tels que le codage d’effacement ont gagné du terrain parmi les fournisseurs de cloud et les opérateurs de stockage hybride et d’objets.

Niveaux raid

Les systèmes RAID protègent les données de deux façons principales – soit en reflétant un disque physique dans son intégralité, soit en stockant des données de parité sur un ou plusieurs disques qui sont utilisés pour reconstruire un disque défectueux.

Les concepteurs de système qui construisent des tableaux RAID doivent équilibrer les performances, la résilience et les surcharges de capacité du miroir ou des données de parité. À son plus simple, RAID 1, ou miroir, copie simultanément toutes les données à deux ou trois lecteurs. La capacité aérienne – la quantité de stockage supplémentaire nécessaire pour les miroirs – est donc soit de 100 % soit de 200 % du stockage utilisable.

D’autres niveaux RAID visent à réduire les frais généraux de stockage et donc le coût sans pénalité de performance indue. RAID 1 offre les meilleures performances et, de manière critique, les temps de reconstruction les plus rapides sans avoir besoin de recréer des données à l’aide de bits de parité.

RAID 4 utilise le décapage au niveau du bloc et stocke les données de parité sur un seul disque. RAID 5 utilise le décapage avec parité distribuée sans avoir besoin d’un disque de parité dédié. RAID 6 utilise la double parité distribuée pour une protection supplémentaire des données. RAID 10 combine miroir et décapage.

Les niveaux RAID 2 et 3 sont rarement utilisés aujourd’hui dans les systèmes d’entreprise. Un certain nombre de fournisseurs ont maintenant des systèmes RAID propriétaires, dans le but de réduire la capacité aérienne encore plus loin que RAID 5 ou RAID 6.

RAID est-il pertinent pour le stockage flash ?

En termes de performances seulement, RAID n’est pas un choix évident pour le stockage flash. Les performances des médias simples battent facilement RAID dans presque tous les scénarios d’entreprise courants.

« Les SSD SAS utilisant le flash NAND offrent un ordre de grandeur inférieur à la latence et un à deux ordres de grandeur plus élevés, selon qu’il s’agit de lectures aléatoires ou séquentielles », explique Eric Burgener, vice-président de la recherche dans la pratique de l’infrastructure d’entreprise d’IDC.

Mais en termes de coût, les supports flash est encore beaucoup plus cher que le disque de filature.

Mis à part la capacité généralement plus faible des supports flash par lecteur, ce qui nécessite l’utilisation de plus grands tableaux, les DSS sont 7x à 8x plus cher que les disques de filature équivalents.

Bien que cela n’exclut pas raid 1 ou RAID 10 pour les tableaux flash, il va le limiter à des applications avec peu de tolérance pour la perte de données, et un besoin de temps de restauration court.

« RAID 1 offre les meilleures performances si vous l’utilisez localement – vous n’avez que deux écrits, ou trois si vous utilisez trois miroirs », explique Burgener. « Il fournit le moins d’impact en mode de récupération, car vous n’avez qu’à lire à partir d’un seul appareil et n’ont pas à effectuer de calcul pour « reconstruire » les données. Mais c’est le plus cher.

RAID 5 et 6: Une option pratique pour flash

Ces coûts élevés ont incité les chercheurs à développer raid 4, 5 et 6. Les technologies sont maintenant matures parce que les fournisseurs de systèmes de stockage se coupent les dents lorsque les disques filature sont plus petits et plus coûteux qu’ils ne le sont aujourd’hui. Une grande partie de ce travail se traduit bien dans le monde du stockage flash.

« Ce coût élevé de redondance est l’une des raisons pour lesquelles des niveaux raid comme RAID 4, 5 ou 6 ou des approches de codage d’effacement ont été développés », explique Burgener. « Ils offrent une capacité beaucoup plus faible au-dessus, mais ils ont tendance à avoir plus d’impact en mode de récupération, car les données doivent être lues à partir de plusieurs appareils et le calcul doit être effectué sur ces données en utilisant une ou plusieurs bandes de parité. »

Toutefois, ces inconvénients sont surmontés, dans une certaine mesure, par les performances plus élevées du stockage flash, en particulier dans les lectures. L’inconvénient demeure qu’un pourcentage important de stockage flash coûteux est mis de côté pour les données de parité. Dans un système RAID 6, wie une mise en page standard de 4+2 (4 bits de données et 2 bits de parité), la surcharge est d’un tiers du stockage.

Pour les systèmes grand public, et où les besoins de stockage de données sont relativement modestes – jusqu’à environ 20 To – RAID 6 est susceptible de suffire. La plupart des architectes it calculent que la plus grande résilience de RAID 6 vaut l’augmentation des coûts ou la pénalité de capacité sur RAID 5. RAID 10 est également une option, généralement pour les applications les plus sensibles à la latence et pour la haute disponibilité.

Protection des données pour les tableaux tout flash et le cloud

Néanmoins, les fournisseurs développent de nouvelles formes de protection des données qui sont mieux adaptées au stockage flash, en réduisant la capacité au-dessus. Ces systèmes exploitent également la plus petite taille moyenne de lecteur pour flash, pour distribuer des données de parité sur plus de volumes.

Les fournisseurs de tableaux tout flash ont largement offert RAID 6 à ce jour, mais un certain nombre d’entreprises ont contesté cela avec de nouvelles technologies.

Kaminario, par exemple, utilise un format 22+2 pour ses tableaux tout flash. Cela réduit les frais généraux, mais ne fonctionne qu’avec des tableaux avec 24 lecteurs ou plus.

VAST Data combine les Disques Intel Optane SSD et QLC SSD et utilise une conception très économique 150+4, qui fonctionne à un frais généraux d’environ 2%. Mais la capacité minimale du système est de 1PB.

Codage d’effacement

L’adoption du codage d’effacement a été entraînée par les grandes plates-formes cloud, mais elle est de plus en plus courante dans le stockage d’objets hybrides et sur place. Le codage d’effacement est susceptible d’être plus commun, notamment parce qu’il donne aux entreprises plus de contrôle sur le niveau de protection qu’elles veulent, ainsi que la redondance physique.

L’inconvénient du codage d’effacement a été en grande partie la performance, bien qu’avec les performances de stockage tout flash, cet écart s’est rétréci.

Dégradation des données : différentes architectures

Les systèmes Flash ont toutefois des différences techniques clés qui affectent la conception des systèmes RAID.

Le stockage flash se détériore plus il est utilisé, et c’est plus le cas avec les écritures que les lectures. Les nouveaux médias flash, mais moins chers, tels que les cellules quad-level (QLC), ont une durée de vie d’écriture plus courte que les générations précédentes de flash NAND. Mais les applications d’entreprise peuvent être à forte intensité d’écriture, de sorte que les concepteurs de matériel doivent créer des techniques pour minimiser les écritures et prolonger la vie professionnelle du système.

Ce n’est pas quelque chose qui se passe avec le disque de filature, de sorte que les services informatique ne peuvent pas simplement « soulever et déplacer » les charges de travail des tableaux conventionnels à flash et s’attendre aux mêmes niveaux de protection.

« Lors de la conception d’algorithmes de protection des données pour les données flash, vous avez de nouvelles entrées – une latence beaucoup plus faible et un débit plus élevé, mais une endurance beaucoup plus faible », explique Burgener. « Les schémas qui minimisent les écritures sont donc plus intéressants. »

Click to comment

Leave a Reply

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Trending