Connect with us

Technologie

Les coûts encourus par les pannes de centres de données « majeures » continuent d’augmenter, selon une étude de l’Institut Uptime

Published

on


Les retombées financières des pannes des centres de données continuent de croître d’année en année (YoY), bien que les exploitants admettent que la plupart des incidents de temps d’arrêt pourraient être évités s’ils investissaient davantage dans la résilience de leurs installations.

C’est selon le Uptime Institute 10E enquête annuelle sur les centres de données, qui contient des réponses compilées auprès de 846 propriétaires et exploitants de fermes de serveurs en mars et avril 2020.

Le rapport confirme que les incidents liés aux temps d’arrêt des centres de données continuent de se produire avec une « fréquence inquiétante », de nombreux exploitants négligeant d’enregistrer officiellement le « nombre inquiétant » de pannes à plus petite échelle qu’ils rencontrent.

« Les pannes dans ces catégories signalent des problèmes plus importants et inquiètent davantage leur fréquence que leur impact singulier », peut-on lire dans le rapport.

Dans le même temps, le rapport note que les pannes de plus en plus importantes sont de plus en plus dommageables et coûteux pour les opérateurs de rebondir, comme la complexité des systèmes logés à l’intérieur du centre de données devient de plus en plus grande.

« Il est clair que les pannes se produisent avec une fréquence inquiétante, que les pannes plus importantes sont de plus en plus dommageables et coûteuses, et ce qui a été gagné dans l’amélioration des processus et de l’ingénierie a été partiellement compensé par les défis de l’entretien de systèmes de plus en plus complexes », indique le rapport d’accompagnement. « Éviter les temps d’arrêt demeure un défi technique et de gestion de premier plan pour tous les propriétaires et exploitants. »

Un tiers des participants au sondage ont admis avoir subi une panne majeure au cours des 12 mois précédents, 31 % déclarant que cela avait causé des dommages « financiers et de réputation substantiels ».

Sur ce point, on a demandé aux exploitants qui ont déclaré avoir subi une panne d’estimer le coût total encouru par leur plus récent événement d’indisponibilité important, un sur six affirmant que leur panne leur avait coûté plus d’un m$. Dans l’enquête de 2019, ce chiffre était d’un sur 10.

Combiné avec la constatation qu’un pourcentage plus élevé (48%) les pannes coûtent maintenant aux entreprises entre 100 000 $ et 1 m$ qu’en 2019 (28 %), selon le Uptime Institute, les données renforcent l’idée que les pannes deviennent des événements de plus en plus coûteux pour les entreprises à surmonter.

« Cela reflète une dépendance croissante de toutes les entreprises et de tous les consommateurs à l’informatique, une interdépendance croissante d’un nombre croissant de systèmes en temps réel et l’immédiateté de l’impact des temps d’arrêt sur les clients », indique le rapport.

Le rapport reconnaît également que la compréhension des causes des pannes est un élément important de la prévention de leur phénomène, les trois quarts des répondants déclarant que leur panne la plus récente était évitable.

Cela dit, le rapport indiquait qu’il peut être difficile d’aller au fond des raisons pour lesquelles une panne s’est produite, en raison de raisons de secret d’entreprise, mais aussi parce que les opérateurs ne procèdent pas à des autopsies approfondies dans les événements liés aux temps d’arrêt.

Malgré cela, lorsqu’on les interroge sur la cause principale de leur panne la plus importante, les problèmes d’alimentation sur place demeurent la principale source de problèmes, suivis par les erreurs logicielles et de systèmes et les problèmes de réseau.

« En dépit de nombreuses préoccupations contraires, les problèmes rencontrés par les fournisseurs de cloud ou de logiciels en tant que service (SaaS) ne causent qu’une faible proportion des pannes », peut-on lire dans le rapport.

« Au cours des dernières années, nos recherches ont montré qu’une proportion croissante de pannes sont causées par des problèmes de logiciels et de réseau. Bien que ces incidents soient plus fréquents et qu’ils puissent être difficiles à résoudre, bon nombre d’entre eux ne causent que des problèmes mineurs. L’impact d’une panne de courant est large et profond, et les effets de choc peuvent être durables – même si la défaillance initiale est rapidement corrigée.

Le rapport indique également que la plupart des gestionnaires et des exploitants se tiennent responsables de toute panne qui s’est produite, avec seulement un quart affirmant que leur panne la plus récente était due à des raisons hors de leur contrôle.

« Cependant, il n’est pas clair si les opérateurs apprennent ouvertement des problèmes de processus ou blâment leurs gestionnaires. Il est également possible que les gestionnaires blâment les opérateurs – ou tous pourraient blâmer les dirigeants pour le sous-investissement », ajoute le rapport.

« Quoi qu’il en soit, les résultats indiquent l’occasion évidente : avec plus d’investissements dans la gestion, les processus et la formation, la fréquence des pannes pourrait presque certainement diminuer de façon significative. »

Click to comment

Leave a Reply

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Trending