Dans le monde d’aujourd’hui axé sur les données, les organisations sont confrontées à la tâche ardue de gérer des paysages de données vastes et complexes. Conscient de ce défi, Gartner, un cabinet mondial de recherche et de conseil, estime que l’architecture du tissu de données est une solution clé.
Table des matières
- Comprendre un tissu de données : la perspective de Gartner
- La vision stratégique de Gartner sur le tissu de données
- Les défis perçus par Gartner dans l’adoption du tissu de données
- Les recommandations de Gartner pour la mise en œuvre du tissu de données
- Le tissu de données de Gartner : Lectures connexes
Comprendre un tissu de données : la perspective de Gartner
Au cœur de la philosophie de Gartner réside l’idée qu’un tissu de données n’est pas un seul outil ou une seule technologie, mais plutôt un “design émergent de gestion des données permettant d’obtenir des pipelines d’intégration de données flexibles, réutilisables et améliorés, ainsi que des services et des sémantiques.”
Le tissu de données est une approche holistique qui intègre divers aspects de la gestion des données dans une architecture unifiée.
L’analogie que Gartner utilise pour décrire un tissu de données est celle d’une “voiture autonome”. Tout comme un véhicule autonome utilise une technologie avancée pour percevoir son environnement et se déplacer sans intervention humaine, un tissu de données utilise des capacités d’apprentissage automatique pour accéder, consolider et gérer les données de manière autonome.
La vision stratégique de Gartner sur le tissu de données
La vision stratégique de Gartner sur le tissu de données repose sur les efficacités qu’il peut apporter. Ils proposent qu’un tissu de données bien mis en œuvre puisse “quadrupler” les niveaux d’efficacité, réduisant ainsi de moitié les tâches de gestion des données intensives en main-d’œuvre.
Par exemple, les scientifiques des données et les analystes passent généralement environ 60 % de leur temps sur des tâches routinières telles que le nettoyage et l’organisation des données. En réduisant considérablement ce pourcentage à l’aide d’un tissu de données, les organisations peuvent consacrer davantage de temps aux tâches à valeur ajoutée telles que l’analyse et l’interprétation des données.
Gartner positionne stratégiquement le tissu de données comme une solution critique qui rationalise les processus chronophages de gestion des données. De plus, Gartner affirme qu’un tissu de données accélère également la transition vers la prise de décision basée sur les données dans les entreprises.
La valeur du tissu de données pour les parties prenantes
Les avantages de la mise en œuvre d’une approche de tissu de données deviennent de plus en plus évidents, de nombreuses entreprises de différents secteurs incorporant déjà ce cadre stratégique. Des entreprises telles qu’IBM et Dell EMC ont utilisé le modèle du tissu de données pour faciliter l’accès et l’analyse des données dans leurs environnements de données variés.
L’une des valeurs les plus significatives offertes par le tissu de données aux parties prenantes réside dans la rupture des silos de données. Les silos de données – des îlots de données isolés inaccessibles aux autres parties de l’organisation – peuvent entraver la circulation de l’information et entraîner des inefficacités.
Le tissu de données résout ce problème en fournissant une vue unifiée et intégrée des données dans toute l’organisation, indépendamment de leur emplacement ou de leur format.
Les défis perçus par Gartner dans l’adoption du tissu de données
Gartner reconnaît que l’adoption d’un tissu de données n’est pas un processus simple et comporte ses propres défis.
Un défi consiste à obtenir le soutien des principales parties prenantes. La mise en œuvre d’un tissu de données nécessite un changement à la fois technologique et culturel, ce qui nécessite l’adhésion de tous les niveaux d’une organisation.
Un autre défi est qu’on ne peut pas acheter un tissu de données “prêt à l’emploi”. Les tissus de données sont conçus pour répondre aux besoins spécifiques d’une organisation.
Heureusement, vous pouvez utiliser des outils tels que des catalogues de données pour accélérer le processus. Les catalogues de données servent de source unique de vérité pour tous les actifs de données, rendant la découverte et la gouvernance des données plus efficaces et favorisant l’adoption d’un tissu de données.
Un autre obstacle est le manque de données, en particulier de métadonnées. Les métadonnées fournissent un contexte et une signification aux actifs de données, les rendant plus faciles à trouver et à comprendre. La collecte, la gestion et l’intégration des métadonnées sont des tâches importantes à prendre en compte lors de la construction d’un tissu de données.
Enfin, la création d’un tissu de données nécessite un ensemble de connaissances spécialisées, notamment des compétences dans des domaines tels que NoSQL, GraphQL et autres.
Les recommandations de Gartner pour la mise en œuvre du tissu de données
Dans leur guide complet intitulé “Des bases de données et de l’analyse : Comment définir, construire et opérationnaliser un tissu de données”, Gartner présente un plan détaillé de recommandations pour mettre en œuvre efficacement un tissu de données :
- Rassembler et examiner tous les types de métadonnées
- Passer d’une métadonnée statique à une métadonnée dynamique
- Développer et gérer des graphiques de connaissances
- Créer une infrastructure solide d’intégration de données
- Établir et utiliser des protocoles et des normes
- Allouer des ressources à des catalogues de données enrichis
Rassembler et examiner tous les types de métadonnées
La collecte et l’analyse de toutes les formes de métadonnées sont des éléments cruciaux de la mise en œuvre d’un tissu de données. Dans le contexte d’un tissu de données, les métadonnées servent de cadre permettant au système de comprendre, d’organiser et de gérer efficacement les données.
Passer d’une métadonnée statique à une métadonnée dynamique
Dans le domaine de la gestion des données, il y a un passage de plus en plus marqué de la métadonnée passive à la métadonnée active.
La métadonnée passive implique une simple documentation des données, comme leur source, leur date de création ou leur format. En revanche, la métadonnée active fournit du contexte, des relations et des filiations, agissant comme une partie vivante et respirante du paysage des données.
Gartner met l’accent sur la transformation de la métadonnée passive en métadonnée active comme une étape cruciale pour exploiter efficacement un tissu de données.
De plus, Gartner souligne la valeur de la visualisation de la métadonnée active et de la dérivation de mesures à partir de celle-ci.
La représentation visuelle rend les données plus compréhensibles et digestibles, facilitant une meilleure prise de décision. Vous pouvez également fournir des mesures de métadonnées actives à des algorithmes d’intelligence artificielle et d’apprentissage automatique, améliorant ainsi leurs performances au fil du temps.
Développer et gérer des graphiques de connaissances
Un outil puissant en matière de gestion des données, notamment dans le contexte du tissu de données, est l’utilisation des graphiques de connaissances. Un graphique de connaissances est un modèle d’un domaine de connaissances créé en connectant et en définissant des relations entre les différentes données.
La création et la gestion de graphiques de connaissances peuvent fournir à une organisation une vue holistique de ses données, offrant des informations significatives sur la manière dont les différents points de données sont liés les uns aux autres. Cela devient particulièrement précieux dans le contexte du tissu de données, car il facilite une compréhension approfondie des données de manière interconnectée et significative.
Créer une infrastructure solide d’intégration de données
Une infrastructure solide d’intégration de données est un élément essentiel de la mise en œuvre réussie d’un tissu de données. Bien qu’il puisse être facile de confondre l’intégration des données avec l’ingestion des données, les deux ont des rôles distincts dans l’écosystème de gestion des données.
L’ingestion des données consiste à importer des données dans un système. Mais l’intégration des données va plus loin. Elle inclut la collecte de données provenant de différentes sources, leur consolidation, puis leur importation de manière à créer une vue unifiée et globale des données.
Différentes méthodes d’intégration des données telles que Extract, Transform, Load (ETL) – et son alternative de plus en plus populaire, Extract, Load, Transform (ELT) -, le streaming, la messagerie et la réplication doivent toutes être prises en charge au sein d’une infrastructure solide d’intégration de données.
Gartner conseille de créer une infrastructure solide d’intégration de données pour une mise en œuvre efficace du tissu de données.
Établir et utiliser des protocoles et des normes
Dans le développement d’un tissu de données complet, il est essentiel de respecter des protocoles et des normes établis. Par exemple, adopter des protocoles tels que la découverte de données ouvertes peut aider à rationaliser la découverte de données au sein d’une organisation. Cela contribue à créer une vue unifiée des données, améliorant ainsi leur accessibilité et leur utilité.
De plus, il est essentiel de veiller à ce que les outils utilisés au sein de votre tissu de données prennent en charge une architecture d’API ouverte. Les API ouvertes facilitent l’intégration et l’interopérabilité entre différentes applications logicielles, favorisant ainsi une plus grande collaboration et efficacité.
Investir dans des catalogues de données augmentés
Investir dans des catalogues de données augmentés est une décision stratégique pour les organisations qui mettent en œuvre une approche de conception de tissu de données. Les catalogues de données augmentés servent de référentiels centralisés, facilitant la collecte de tous types de métadonnées et favorisant ainsi une gestion efficace des données.
Dans le contexte du tissu de données, un catalogue de données joue un rôle crucial dans le maintien de la cohérence et de l’utilisabilité des données. Il aide à la gestion et à la compréhension des données dans toute l’organisation en capturant les métadonnées et en fournissant un référentiel consultable.
En conclusion
Selon Gartner, un tissu de données est une approche de conception innovante pour la gestion des données, caractérisée par la flexibilité, la réutilisabilité et l’intégration améliorée des données. Ce n’est pas un outil ou une technologie unique, mais une stratégie globale qui exploite les capacités des machines pour accomplir des tâches telles que le profilage des données, la découverte de schémas et la création de jeux de données auto-guérisseurs.
La pierre angulaire d’une stratégie de tissu de données réussie réside dans un catalogue de données ouvert et solide. C’est ce composant crucial qui relie les fils disparates de données au sein d’une organisation, offrant une vue unifiée, consultable et exploitable des données.
Le tissu de données de Gartner : Lectures connexes
- Guide de recherche sur les catalogues de données de Gartner : Comment lire les guides de marché, les quadrant magiques et les avis entre pairs
- Un guide sur la recherche de Gartner sur la gouvernance des données : Guides de marché, cycles de hype et avis entre pairs
- Gestion de métadonnées actives de Gartner : Concept, guide de marché, opinions des pairs, quadrant magique et cycle de hype
- Métadonnées actives : Votre guide 101 des personnes qui ont pionnier le concept et sa compréhension
- Rapport de la grille G2® pour la gouvernance des données : Comment l’utiliser pour choisir la bonne plateforme de gouvernance des données pour votre organisation ?
- Rapport de la grille G2® pour les catalogues de données d’apprentissage automatique : Comment l’utiliser pour choisir le bon catalogue de données pour votre organisation ?