Les Fabriques de Données, aussi connues sous le terme anglais “Data Fabric”, sont des services de données et API qui regroupent les informations provenant de divers systèmes tels que des datalakes, des entrepôts de données SQL, des bases de données, et des applications. Elles offrent une vision globale des performances de l’entreprise. Par opposition aux systèmes de stockage de données individuels, une Fabrique de Données vise à créer une plus grande fluidité dans les environnements de données, en contrecarrant le problème de la gravité des données. En d’autres termes, elle résout le défi de déplacer des données de plus en plus volumineuses.
Une Fabrique de Données élimine les complexités technologiques liées au déplacement, à la transformation et à l’intégration des données, rendant ainsi toutes les informations disponibles à travers toute l’entreprise.
L’Architecture de la Fabrique de Données
Les architectures de Fabrique de Données fonctionnent en couplant de manière lâche les données provenant de différentes plateformes avec les applications qui en ont besoin. Par exemple, dans un environnement multi-cloud, une architecture de Fabrique de Données peut être composée d’AWS pour la gestion de l’ingestion des données, d’Azure pour la transformation et la consommation des données, et d’IBM® Cloud Pak for Data pour les services analytiques. Cette architecture permet d’assembler ces différents environnements pour créer une vue unifiée des données.
Il convient de noter qu’il n’existe pas une seule architecture de données pour une Fabrique de Données, car les besoins des entreprises peuvent varier. Le nombre de fournisseurs de cloud et les différentes implémentations de l’infrastructure de données entraînent des variations entre les entreprises.
Cependant, les entreprises utilisant ce type de cadre de données partagent des caractéristiques communes dans leurs architectures, propres à la Fabrique de Données. Ces caractéristiques sont décrites dans le rapport “Enterprise Data Fabric Enables DataOps” par Forrest. Ces six composantes fondamentales comprennent :
Couche de gestion des données
Cette couche est responsable de la gouvernance et de la sécurité des données.
Couche d’ingestion de données
La couche d’ingestion de données commence à collecter les données à partir du cloud, en identifiant les connexions entre les données structurées et non structurées.
Traitement des données
La couche de traitement des données raffine les informations pour s’assurer que seules les données pertinentes sont extraites.
Orchestration des données
Cette couche critique effectue certaines des tâches les plus importantes pour la Fabrique de Données : la transformation, l’intégration et le nettoyage des données, afin de les rendre utilisables par les équipes de l’entreprise.
Découverte de données
Cette couche offre de nouvelles opportunités d’intégration de différentes sources de données. Par exemple, elle peut permettre de connecter des données provenant d’un data mart de la chaîne d’approvisionnement avec un système de gestion de la relation client, offrant ainsi de nouvelles opportunités de proposer des produits aux clients ou d’améliorer leur satisfaction.
Accès aux données
Cette couche permet la consommation des données en garantissant les autorisations appropriées à certaines équipes afin de se conformer aux réglementations gouvernementales. De plus, elle facilite l’identification des données pertinentes grâce à des tableaux de bord et d’autres outils de visualisation.
Image: [source ici]
En conclusion, les Fabriques de Données sont des outils puissants qui permettent aux entreprises d’avoir une vue globale de leurs informations. Elles simplifient le stockage, la gestion et l’exploitation des données, aidant ainsi les équipes à prendre de meilleures décisions basées sur des informations précises et actualisées.