Qu’est-ce qu’une toile de données ?
Le concept d’une “toile de données” émerge comme une approche pour aider les organisations à mieux gérer les données en constante croissance, les exigences des applications en évolution et les besoins de traitement distribué. Ce terme fait référence à une technologie qui crée une plate-forme convergente supportant le stockage, le traitement, l’analyse et la gestion de données disparates. Les données actuellement stockées dans des fichiers, des tables de base de données, des flux de données, des objets, des images, des données de capteurs et même des applications basées sur des conteneurs peuvent toutes être accessibles via plusieurs interfaces standard différentes.
Une toile de données permet aux applications et aux outils de récupérer les données en utilisant de nombreuses interfaces telles que NFS (Network File System), POSIX (portable operating system interface), une API REST (representative state transfer), HDFS (Hadoop distributed file system), ODBC (open database connectivity) et Apache KAFKA pour les données de streaming en temps réel. Une toile de données doit également être capable d’être améliorée pour prendre en charge d’autres normes au fur et à mesure de leur émergence.
Il y a plusieurs objectifs qu’une toile de données doit atteindre, notamment :
- Regrouper les données provenant de systèmes établis – quelle que soit leur taille et leurs besoins futurs en termes de scalabilité, et rendre ces données disponibles pour les applications.
- Fournir vitesse, échelle et fiabilité – l’accès aux données stockées dans la toile de données doit répondre aux exigences commerciales en termes de vitesse, d’échelle et de fiabilité, quel que soit l’environnement informatique, sans compromis.
- Prendre en charge plusieurs emplacements – permettre l’accès aux données à partir de systèmes situés à la périphérie du réseau, dans le centre de données d’entreprise et même dans des environnements de cloud computing (Amazon Web Services, Microsoft Azure et Google Cloud Platform).
- Créer un environnement de données unifié – la toile de données doit créer un espace de noms global rendant les fichiers faciles à trouver et à récupérer, offrir des niveaux élevés de sécurité, fournir une compression pour réduire les besoins de stockage globaux, permettre une capture instantanée des données pour les sauvegardes et pour le développement d’applications, ainsi que prendre en charge les environnements informatiques multi-locataires (plusieurs entreprises).
- Fournir une fiabilité et une disponibilité élevées – la toile de données doit offrir un environnement hautement fiable qui s’auto-gère et se répare en cas de problème, et assurer une disponibilité élevée pour répondre aux besoins essentiels de l’entreprise.
Pourquoi devriez-vous vous en soucier ?
La raison pour laquelle le concept d’une toile de données est devenu important pour les grandes entreprises est que les entreprises sont confrontées à d’importants défis aujourd’hui. Leurs systèmes informatiques deviennent plus complexes que jamais. Ils ont besoin de la capacité de travailler sur des environnements disparates complexes tout en prenant en charge les applications existantes et les nouvelles applications basées sur des microservices.
Dans le passé, chaque équipe de développement d’applications choisissait sa propre approche de stockage et de récupération des données. Si nous examinions ce qui s’exécute dans le centre de données d’entreprise typique, nous constaterions que les données sont stockées dans des fichiers plats, dans des bases de données relationnelles (SQL), dans des bases de données non relationnelles (NoSQL) et même dans des référentiels de Big Data ayant leurs propres approches de stockage de contenu. La répartition résultante des données en silos séparés est l’un des principaux défis auxquels les organisations sont confrontées aujourd’hui.
Pourquoi l’unification est-elle un tel problème ?
Unifier toutes ces données peut poser un réel problème. Les applications stockent les mêmes données sous différents formats. Les données sont stockées à de nombreux endroits, dans différents silos d’applications, et cela signifie que le processus d’unification nécessiterait de “dédupliquer” les données en double. Obtenir les données à la bonne application, au bon moment et de la bonne manière n’est pas un problème facile à résoudre.
Un autre défi est que le travail est de plus en plus effectué à la périphérie du réseau plutôt qu’au sein du centre de données d’entreprise. Les clients et le personnel disposent désormais d’applications qui accèdent aux données depuis leurs smartphones, leurs machines et une gamme de nouvelles sources alimentées par l’Internet des objets (IoT). Cela signifie que les organisations doivent traiter efficacement les données générées à la périphérie, les partager et en tirer des enseignements, puis renvoyer l’intelligence à ces appareils périphériques.
Les entreprises commencent à comprendre qu’un simple changement, comme la mise à jour d’une application ou d’un outil de développement pour se conformer à de nouvelles réglementations, répondre à de nouvelles exigences commerciales ou adopter de nouvelles technologies, peut créer des incompatibilités qui se font ressentir dans toute l’entreprise. Les incompatibilités se traduisent rapidement par des problèmes, et les problèmes équivalent à du temps et de l’argent.
Le transfert des données vers une toile de données peut répondre aux besoins d’un environnement de données mondial et agile, capable d’optimiser les coûts, les performances, de respecter les nouvelles réglementations gouvernementales et de minimiser les problèmes futurs à mesure que de nouvelles technologies, telles que les serveurs basés sur de nouvelles architectures de microprocesseurs telles que ARM ou NVIDA, deviennent de plus en plus courantes.
Comment en apprendre davantage ?
Si votre entreprise ressent actuellement les effets de ces défis ou si vous souhaitez simplement prendre une longueur d’avance sur vos concurrents, un certain nombre de fournisseurs proposent des outils qui répondent à certaines ou à toutes ces exigences. MapR Technologies propose déjà une plate-forme de données convergente qui répond à toutes les exigences que j’ai mentionnées précédemment dans cet article. NetApp utilise actuellement le terme “toile de données”, mais se concentre principalement sur un niveau inférieur de solutions – sauvegarde/DR, synchronisation des données avec le stockage cloud, prise en charge d’un connecteur rapide vers des clusters Hadoop et des bases de données MongoDB. Talend utilise également le terme “toile de données”, mais dans le cas de ce fournisseur, l’accent est mis sur la génération de code natif optimisé (Java/Spark/SQL) conçu pour accéder au stockage basé sur le cloud.
La vision d’une toile de données offre de nombreuses opportunités pour aider les entreprises à répondre aux exigences commerciales de l’unification des données et à simplifier et accélérer les solutions informatiques complexes d’aujourd’hui. Je recommanderais aux fournisseurs de démontrer la vision la plus large de ce que cette vision peut signifier et d’avoir déjà une expérience réussie de sa mise en œuvre.
Cet article, “Qu’est-ce qu’une toile de données et pourquoi devriez-vous vous en soucier ?”, a été initialement publié par Network World.