Connect with us

Technologie

Comment le stockage informatique offre des avantages pour les centres de données

Published

on


L’objectif d’une architecture de stockage de calcul est soit de réduire la nécessité de déplacer des jeux de données volumineux, soit d’alléger les contraintes sur les ressources de calcul ou de stockage existantes, comme dans un déploiement edge, par exemple.

L’un des facteurs qui stimulent le développement du stockage informatique est celui des données – ou, pour être plus précis, des volumes croissants de données auxquels les organisations doivent de plus en plus faire face. Les organisations se tournent vers la science des données, l’analyse des données et l’apprentissage automatique pour glaner des informations à partir de toutes ces données, mais celles-ci sont très gourmandes en données et ont tendance à être liées par des vitesses d’entrée / sortie (E / S) ou sont sensibles à la latence. Il est donc plus logique de traiter les données aussi près que possible de l’endroit où elles sont stockées, plutôt que de mélanger des gigaoctets ou des téraoctets en mémoire et insufflé.

Les entreprises qui développent des produits de stockage informatique ont adopté différentes approches architecturales, de l’intégration de processeurs dans des disques aux accélérateurs qui se connectent à un emplacement PCIe et accèdent aux magasins de données existants via NVMe.

Pour éviter une balkanisation de l’écosystème de stockage informatique naissant en lignes de produits mutuellement incompatibles, la Storage Networking Industry Association (SNIA) a formé un groupe de travail technique (TWG) sur le stockage informatique. Le groupe travaille à définir des normes et à développer un modèle de programmation commun qui permettra aux applications de découvrir et d’utiliser toutes les ressources de stockage de calcul qui peuvent être attachées à un système informatique.

SNIA a divisé la définition des périphériques de stockage computationnels en processeurs de stockage de calcul (CSP), lecteurs de stockage de calcul (CSD) et baies de stockage de calcul (CSAs). Un fournisseur de services cryptographiques contient un moteur de calcul, mais ne contient en fait aucun stockage lui-même. Un CSD (généralement un disque SSD/SSD) contient à la fois le calcul et le stockage. Un CSA contient un ou plusieurs moteurs de calcul et périphériques de stockage.

Le modèle SNIA inclut une liste de fonctions de stockage de calcul qui peuvent être exécutées par des périphériques de stockage de calcul, telles que la compression et la décompression. Certains produits de stockage informatique ont été conçus pour exécuter des fonctions spécifiques, telles que l’encodage vidéo ou le décodage, tandis que d’autres ont été conçus pour être programmables par l’utilisateur.

Fournisseurs notables

NGD Systems est l’un des fournisseurs de stockage informatique les plus importants. Ses produits sont des SDC sous la définition SNIA, intégrant le traitement de calcul dans un SSD NVMe. Ceci est réalisé par l’utilisation d’un circuit intégré personnalisé spécifique à l’application (ASIC) qui intègre à la fois les fonctions du contrôleur SSD et un bloc CPU Arm Cortex-A53 quad-core.

Cette architecture présente plusieurs avantages. L’ASIC a un accès direct aux puces flash Nand dans le lecteur via les canaux de l’interface flash commune (CFI), et ceux-ci fournissent un accès à bande passante élevée et à faible latence aux données, par rapport au transfert de données en mémoire pour que la CPU hôte les traite.

Grâce aux cœurs Arm intégrés, les appareils de NGD peuvent exécuter une version d’Ubuntu Linux, qui simplifie le développement et le déploiement d’applications, ou Azure IoT Edge de Microsoft. Le lecteur lui-même est également accessible en tant que simple SSD standard.

Ce type d’architecture est bien adapté aux déploiements en périphérie, où il peut n’y avoir que suffisamment d’espace ou de puissance suffisante pour un seul serveur de périphérie, mais avec des exigences exigeantes pour analyser les données en temps réel, telles qu’un flux vidéo à partir d’une caméra de sécurité. NGD a un Présentation de la solution sur son site Web qui décrit comment une base de données MongoDB peut être partitionnée sur plusieurs SSD CSD à l’intérieur d’un seul serveur plutôt que sur plusieurs nœuds de serveur, réduisant ainsi l’encombrement du centre de données et le coût global tout en offrant une latence plus faible lors de la réplication des données.

NGD cite également comme cas d’utilisation l’intelligence artificielle (IA) automobile, les réseaux de diffusion de contenu et les centres de données hyperscale, et propose un système de développement de traitement in situ (ISDP) entièrement intégré qui permet aux développeurs et aux intégrateurs de créer et de déployer des applications.

Samsung a un produit CSD similaire, mais son SmartSSD intègre un réseau de portes programmables sur le terrain Xilinx (FPGA) et un contrôleur SSD Samsung NVMe à l’intérieur d’un SSD à facteur de forme standard 2.5in (U.2) d’une capacité allant jusqu’à 4TB. Le produit résultant est commercialisé par Xilinx.

Xilinx fournit une plateforme de développement, Vitis, qui permet le développement en C, C++ ou OpenCL. Il permet également aux organisations de créer des applications accélérées via un ensemble de bibliothèques open source optimisées pour le FPGA Xilinx dans le SmartSSD. Il existe des bibliothèques Vitis pour accélérer l’inférence d’IA, l’analyse de données, la finance quantitative et autres. Xilinx affirme que l’utilisation de la couche d’hyper-accélération de Bigstream, SmartSSD peut rendre l’analyse Apache Spark 10 fois plus rapide.

Pendant ce temps, les produits NoLoad d’Eideticom sont des CSP, en ce qu’ils contiennent un moteur d’accélérateur mais pas de stockage. Au lieu de cela, ils se connectent au stockage et au processeur hôte via NVMe, ce qui permet de mettre à l’échelle le calcul et le stockage indépendamment. En fait, avec la prise en charge de NVMe-oF, les données pourraient également être conservées dans des baies de stockage externes.

Les périphériques NoLoad utilisent un FPGA comme accélérateur et sont disponibles sous la forme d’une carte PCIe, d’un facteur de forme U.2 comme un boîtier de lecteur ou du format EDSFF, basé sur le format SSD Ruler d’Intel. NoLoad peut prendre en charge une gamme de fonctions, telles que la compression, le chiffrement, le codage d’effacement, la déduplication, l’analyse de données et l’apprentissage automatique (ML).

Des périphériques NoLoad ont déjà été déployés au Laboratoire national de Los Alamos (LANL) dans le cadre d’un système de stockage de nouvelle génération pour le calcul haute performance (HPC). Ainsi, les périphériques NoLoad ont été utilisés pour décharger les tâches de stockage clés dans un système de fichiers Lustre/ZFS, ce qui a permis d’améliorer les performances et de réduire les coûts pour le système de stockage.

Pliops cible également le stockage, qui utilise une carte PCIe avec un FPGA pour accélérer les opérations clé-valeur utilisées dans des applications telles que les bases de données. Le processeur de stockage Pliops (PSP) met en œuvre une structure de données optimisée pour les opérations de stockage liées aux bases de données, telles que l’indexation, la recherche ou le tri, et les accélère sans nécessiter de modifications logicielles de l’application. Pour ce faire, il remplace le moteur de stockage clé-valeur sous-jacent, tel qu’InnoDB, l’option par défaut pour MySQL, par son accélérateur matériel. Pliops affirme que cette implémentation peut fournir 10 fois le nombre de requêtes par seconde, tout en utilisant plus efficacement l’espace de stockage SSD, offrant une valeur commerciale immédiate.

Les GPU peuvent également effectuer un stockage informatique

L’exemple d’accélérateur de stockage de calcul le plus extrême est peut-être Nyriad. La société a développé une plate-forme de stockage définie par logiciel appelée Nsulate qui utilise un GPU Nvidia pour accélérer les fonctions de codage d’effacement. Il est conçu comme une alternative au RAID pour les déploiements de stockage avec montée en puissance parallèle hautes performances nécessitant un niveau élevé de fiabilité.

En fait, il est censé être capable de faire face à des dizaines de défaillances simultanées de l’appareil en temps réel, sans dégradation des performances, car Nsulate peut reconstruire toutes les données manquantes plus rapidement que les données ne peuvent être extraites du stockage. Cela signifie que le remplacement d’un lecteur défectueux n’a pas besoin d’être une priorité élevée pour l’équipe informatique. Nyriad affirme que le GPU peut être utilisé simultanément pour d’autres charges de travail telles que l’apprentissage automatique.

Nsulate est actuellement disponible dans le cadre de systèmes prédéfinis par des partenaires tels que Boston Limited, qui propose un serveur de stockage Nsulate basé sur Supermicro.

Le stockage informatique en est encore à un stade précoce de développement, bien que certains fournisseurs proposent des produits déployables depuis plusieurs années. Les organisations qui l’évaluent pour leur centre de données doivent donc faire preuve de prudence, mais il y a déjà des avantages à tirer de l’utilisation de produits de stockage informatique dans certaines applications. Ils peuvent entraîner une réduction de la consommation d’énergie globale et la nécessité de moins de cœurs de processeur par nœud de serveur, par exemple, ainsi que d’une amélioration significative des performances dans de nombreux cas.

Click to comment

Leave a Reply

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Tendance