Stockage des données : Quand l’intelligence artificielle automatise la prise de décision

Stockage des données : Quand l’intelligence artificielle automatise la prise de décision
Actu IA
STOCKAGE DONNEES

Par Jean-Philippe Pouquet, Enterprise Sales Manager pour la France chez Infinidat (fournisseur de software-defined storage pour les entreprises)

Cassettes, disques amovibles, disques durs et SSD – les débuts du marché du stockage de données semblent aujourd’hui loin derrière nous. Et il ne cesse de se diversifier. Au fur et à mesure que l’intelligence artificielle (IA) progresse, la façon dont nous stockons les données promet également de devenir plus intelligente – et donc plus efficace, flexible et rentable pour les entreprises.

Les organisations qui souhaitent stocker de manière fiable leurs volumes de données en croissance exponentielle (aujourd’hui de l’ordre d’un à plusieurs dizaines de pétaoctets) disposent désormais d’un large éventail de choix, parfois déroutant du fait de sa densité. Quelle influence l’IA peut-elle avoir sur le marché du stockage ? Est-elle une opportunité ou un nouveau défi ?

Une stratégie de stockage informatique basée sur les besoins de données

En principe, les responsables informatiques souhaitent que les données soient stockées sur des supports de données aussi rapides que possible afin de garantir un accès instantané aux informations. Mais dans quelle mesure est-il judicieux de toujours stocker toutes les données sur les supports les plus performants ? Le disque Flash est beaucoup plus rapide que le disque Nearline SAS (NL-SAS), mais aussi beaucoup plus cher.

Il est de toute façon peu judicieux de stocker toutes les données sur Flash, car la plupart des données ne sont pas utilisées en permanence. En outre, certaines données doivent être stockées pendant une longue période en raison des règles de conformité, ou pour des besoins tels que la préparation d’analyses à long terme. Même les fichiers de sauvegarde n’ont pas besoin d’être stockés sur Flash – ils n’entrent en jeu que lors de la restauration d’un ensemble de données mais quand la restauration est nécessaire, elle doit être la plus rapide possible. Les responsables informatiques doivent donc faire évoluer constamment leur stratégie de stockage afin de déterminer les supports optimaux pour chaque application.

Stratégie de stockage : les limites de l’approche « artisanale »

Jusqu’à présent, les données étaient stockées en fonction des paramètres définis par la politique de stockage, mise en place dès la création des structures correspondantes. Ces paramètres restent ensuite quasiment inchangés, bien que des modifications mineures puissent être apportées au cours des activités opérationnelles. Néanmoins, la quantité et, surtout, la nature des données changent rapidement.

Si auparavant, les données étaient largement standardisées en raison des capacités limitées des systèmes informatiques de l’époque, l’intervention manuelle constante pour rester conforme à la politique de stockage devient de plus en plus complexe et mobilise de plus en plus de personnel. Des structures de données plus complexes nécessitent même des ajustements plus réguliers car le mauvais choix de l’emplacement de stockage peut peser sur le budget, soit en utilisant un stockage coûteux pour des données non pertinentes, soit en perturbant les opérations par un accès plus lent aux données pertinentes.

L’intelligence artificielle permet des ajustements automatisés

Comment résoudre ce dilemme ? L’une des solutions consiste à utiliser l’intelligence artificielle. L’automatisation effectue les ajustements seconde par seconde sans intervention manuelle, ce qui permet aux entreprises de stocker leurs données de manière plus rentable.

Grâce à l’apprentissage automatique, un moteur d’IA peut évaluer le comportement des utilisateurs et la nature de l’accès aux données, pour attribuer l’emplacement de stockage. Il peut également simuler les schémas selon le type d’accès à mettre en place pour s’adapter aux usages futurs ainsi que pour faire des prévisions sur la mémoire requise et les performances requises à l’avenir, ce qui permet une planification stratégique d’infrastructure et de budget. Un objectif important à cet égard est d’éviter l’utilisation de ressources inutiles.

Classement de données via des algorithmes de gestion de cache

L’une des façons dont les responsables informatiques peuvent tirer parti de l’intelligence artificielle pour un stockage plus intelligent est la mise en œuvre d’un algorithme de gestion de la mise en cache.

Un tel algorithme utilise des algorithmes d’apprentissage automatique pour balayer le pool de données et analyser les schémas de données afin de trouver des corrélations cachées. Par conséquent, il décide quelles données sont pertinentes pour un accès immédiat par les applications ou directement par l’utilisateur. L’algorithme classe les données selon la fréquence d’utilisation :

  • Les données fréquemment utilisées sont automatiquement stockées en RAM, une vitesse d’exécution bien plus rapide que Flash.
  • Viennent ensuite les données “tièdes”, qui sont analysées assez souvent mais ne sont pas utilisées constamment et sont stockées en Flash.
  • Enfin, les données les moins fréquemment utilisées sont stockées sur des disques NL- SAS, beaucoup plus économiques.

Avantages d’un algorithme de gestion de mise en cache

Une stratégie de stockage reposant sur l’intelligence artificielle présente des avantages non-négligeables pour les systèmes informatiques. Dans une baie de stockage combinant DRAM, médias Flash (SSD) et disques NL-SAS, un algorithme de gestion de mise en cache réduit la latence et accélère l’accès en lecture/écriture.

Temps de latence réduit : La plupart des applications sont transactionnelles, nécessitant au moins deux opérations d’E/S distinctes. Une opération est toujours utilisée pour intégrer la transaction aux registres, l’autre pour l’opération d’écriture réelle des données. Les latences peuvent donc avoir un effet exorbitant sur les performances.

Les temps de réponse de la couche de métadonnées affectent donc la performance maximale de l’application. Les opérations de lecture et d’écriture – c’est-à-dire les insertions, les modifications et les suppressions dans la structure des métadonnées – sont traitées avec le même temps de latence.

Ces opérations sont effectuées sans prétraitement, comme la suppression de schémas, la compression ou le cryptage directement dans la DRAM du serveur de stockage. Pendant ce temps, une deuxième copie de l’opération d’écriture est effectuée dans la DRAM d’un autre nœud de stockage à faible latence RDMA et une confirmation est envoyée à l’hôte seulement après. L’écriture directe sur la DRAM connectée à l’unité centrale du serveur permet d’obtenir une latence globale plus faible que l’accès direct à un périphérique Flash externe.

Accès accéléré en lecture/écriture : L’utilisation d’un seul grand pool de mémoire pour accepter l’accès en écriture – contrairement aux architectures traditionnelles où le cache d’écriture est divisé en sections plus petites – permet de maintenir de plus grandes salves d’écriture.

Les données qui changent fréquemment peuvent être écrasées par la latence de la DRAM, ce qui permet à l’algorithme de gestion de cache de décider intelligemment quels blocs de données peuvent être stockés sur quel support. La plus longue conservation des données dans le cache d’écriture signifie que l’unité centrale et les backends sont soulagés. L’algorithme peut également accélérer les opérations de lecture en maintenant les données les plus actives dans la DRAM.

La réduction de la latence et l’accélération de l’accès en lecture/écriture ne sont que deux des nombreux avantages de l’intelligence artificielle en matière de stockage. Les algorithmes de stockage deviennent plus intelligents en se nourrissant de grands ensembles de données et en identifiant des schémas.

L’intégration de l’intelligence artificielle dans les stratégies de stockage, par exemple au moyen d’un algorithme de gestion de mise en cache, permet aux responsables informatiques de réduire leurs dépenses de stockage – qui constituent déjà un élément clé de leur budget – et de libérer des fonds pour investir dans l’innovation et la transformation. Des éléments qui tirent la compétitivité du marché vers le haut et façonnent le visage des entreprises de demain.