Connect with us

Technologie

Fichier, bloc et objet : les principes fondamentaux du stockage à l’ère du cloud

Published

on


Malgré les nombreux changements dans le stockage des données au fil des décennies, certains fondamentaux demeurent. L’une d’entre elles est que le stockage est accessible par l’une des trois méthodes suivantes : bloc, fichier et objet.

Cet article définira et développera les caractéristiques de ces trois, tout en examinant les produits sur site et dans le cloud que vous trouverez généralement qui utilisent le stockage de fichiers, de blocs et d’objets.

Ce que nous voyons, c’est que si des produits de stockage de blocs, de fichiers et d’objets sur site (généralement) à facteur de forme matériel sont disponibles, ces types d’accès au stockage sont également proposés dans le cloud pour servir les charges de travail qui en ont besoin.

L’essor du cloud a également conduit à des formes hybrides – datacenter et cloud – et distribuées de stockage de fichiers et d’objets.

Ainsi, bien que les fichiers, les objets et les blocs soient des principes fondamentaux de longue date du stockage, les façons dont ils sont déployés à l’ère du cloud changent.

Fichier et bloc: tout et partie

Le système de fichiers a toujours été un pilier de la technologie de stockage. Le stockage par blocs et accès aux fichiers offre deux façons d’interagir avec le système de fichiers.

Le stockage d’accès aux fichiers est lorsque vous accédez à des fichiers entiers via le système de fichiers. Habituellement, cela se fait via un stockage rattaché au réseau (NAS) ou une grille liée de nœuds NAS évolutifs. Ces produits sont livrés avec leur propre système de fichiers à bord et le stockage est présenté aux applications et aux utilisateurs dans le format de lettre de lecteur.

Dans l’accès par blocs, le produit de stockage – généralement déployé sur site dans les systèmes SAN (Storage-Area Network), par exemple – ne traite que les blocs de stockage dans les fichiers, les bases de données, etc. En d’autres termes, le système de fichiers par lequel les applications communiquent réside plus haut dans la pile.

Les systèmes de fichiers offrent toutes sortes d’avantages. L’un des plus importants est que c’est ainsi que la plupart des applications d’entreprise sont écrites – et cela ne disparaîtra pas trop tôt.

Une caractéristique clé des méthodes basées sur le système de fichiers est qu’il existe des méthodes – telles que celles trouvées dans le jeu de commandes Posix – pour verrouiller les fichiers afin de s’assurer qu’ils ne peuvent pas être simultanément écrasés, du moins pas d’une manière qui corrompt le fichier ou les processus qui l’entourent.

Le stockage de fichiers accède à des fichiers entiers, de sorte qu’il est utilisé pour le stockage général de fichiers, ainsi que pour des charges de travail plus spécialisées qui nécessitent un accès aux fichiers, comme dans les médias et le divertissement. Et, sous sa forme NAS évolutive, il s’agit d’un pilier des référentiels à grande échelle pour les charges de travail d’analyse et de calcul haute performance (HPC).

Le stockage par blocs permet à l’application d’accéder aux blocs que les fichiers composent. Il peut s’agir d’un accès à la base de données où de nombreux utilisateurs travaillent sur le même fichier simultanément et éventuellement à partir de la même application –e-mail, applications d’entreprise telles que la planification des ressources d’entreprise (ERP), par exemple – mais avec verrouillage au niveau du sous-fichier.

Le stockage par blocs présente le grand avantage d’être performant et de ne pas avoir à gérer les métadonnées et les informations du système de fichiers, etc.

Fichier et bloc : cloud et distribué

Le stockage de fichiers existe toujours au format NAS autonome, en particulier au niveau d’entrée, et le NAS évolutif, destiné au déploiement sur site, est monnaie courante.

Mais l’avènement du cloud, et sa tendance à mondialiser les opérations, a affecté les choses a eu un double effet.

D’une part, il existe un certain nombre de fournisseurs qui proposent des systèmes de fichiers globaux qui combinent un système de fichiers distribué sur le cloud public et le matériel de réseau local, avec toutes les données dans un seul espace de noms. Les fournisseurs ici incluent Ctera, Nasuni, Panzura, Hammerspace et Peer Software.

D’autre part, tous les principaux fournisseurs de cloud – Amazon Web Services, Google Cloud Platform et Microsoft Azure – proposent leurs propres services de stockage d’accès aux fichiers, ainsi que ceux de NetApp, dans le cas d’AWS. IBM propose également un stockage de fichiers via son offre cloud.

Bloquer dans le cloud

Certains fournisseurs de stockage, tels qu’IBM et Pure, proposent des instances de leur stockage par blocs dans le cloud. Et les trois grands offrent tous des services de stockage par blocs dans le cloud, destinés aux applications qui nécessitent la latence la plus faible, telles que les bases de données et la mise en cache analytique, ainsi que le travail sur machine virtuelle (VM).

Probablement en raison de la nature du stockage par blocs et de ses exigences de performances, aucun stockage par blocs distribués ne semble avoir émergé de la même manière qu’avec le fichier.

Stockage d’objets : un monde à part

Le stockage d’objets est basé sur une structure « plate » avec un accès aux objets via des IDENTIFIANTs uniques, similaire à la méthode DNS (Domain Name System) pour accéder aux sites Web.

Pour cette raison, le stockage d’objets est très différent de la structure hiérarchique du système de fichiers arborescent, ce qui peut être un avantage lorsque les jeux de données deviennent très volumineux. Certains systèmes NAS ressentent le stpluie quand ils arrivent à des milliards de fichiers.

Le stockage d’objets accède aux données à l’équivalent du niveau du fichier, mais sans verrouillage de fichier, et souvent plusieurs utilisateurs peuvent accéder à l’objet en même temps. Le stockage d’objets n’est pas très cohérent. En d’autres termes, il est finalement cohérent entre les copies en miroir qui existent.

La plupart des applications héritées ne sont pas écrites pour le stockage d’objets. Mais loin d’être nécessairement un inconvénient, historiquement parlant, le stockage d’objets est en fait la méthode d’accès au stockage de choix pour l’ère du cloud. En effet, le cloud est généralement beaucoup plus une proposition sans état que l’environnement d’entreprise hérité, et comprend également probablement la majeure partie du stockage offert par les grands fournisseurs de cloud.

En outre, les objets dans le stockage d’objets offrent un ensemble de métadonnées plus riche que dans un système de fichiers traditionnel. Cela rend également les données dans le stockage d’objets bien adaptées à l’analyse.

Objet dans le cloud – et sur site avec fichier

Le cloud a été la maison naturelle du stockage d’objets. La plupart des services de stockage proposés par les fournisseurs de cloud sont basés sur le stockage d’objets, et c’est là que de nouvelles normes de facto, telles que S3, ont émergé.

Avec son accès facile à des données qui peuvent heureusement exister comme largement apatrides et finalement cohérentes, l’objet est le stockage en vrac de l’ère du cloud.

Vous pouvez obtenir un stockage d’objets pour un déploiement sur site, tel que Elastic Cloud Storage de Dell EMC, qui est uniquement destiné au déploiement de centres de données. Pendant ce temps, Hitachi Content Platform d’Hitachi Vantara, Cloud Object Storage d’IBM et StorageGrid de NetApp peuvent fonctionner dans des scénarios hybrides et multicloud.

Certains fournisseurs spécialisés dans le stockage d’objets, tels que Cloudian et Scality, proposent des déploiements sur site et hybrides.

Et dans le cas de Scality, avec Pure Storage (et NetApp, dans une certaine mesure), le stockage convergent de fichiers et d’objets est possible, la raison en étant que les clients veulent de plus en plus accéder à de grandes quantités de données non structurées qui peuvent être dans des formats de stockage de fichiers ou d’objets.

Click to comment

Leave a Reply

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Tendance