Collecte et traitement des données
- Comprendre les besoins métiers des différentes unités demandeuses et utilisatrices de solutions pour collecter et stocker les données.
- Développer des solutions techniques de collecte des données via des API.
- Concevoir des solutions techniques pour le stockage des données (Hadoop).
- Effectuer des tests unitaires et d’intégration.
- Mettre en place et maintenir les automatisations de traitements de données.
Mise à disposition des données pour les équipes utilisatrices
- Industrialiser et automatiser le nettoyage des données selon les spécifications requises.
- Gérer, maintenir et documenter plusieurs bases de données (importation de données externes en open data ou de données internes, par exemple).
- Gérer le cycle de vie des données conformément aux directives du RGPD.
- Assurer le suivi de la production et de la maintenance des données.
Mise en production de modèles statistiques dans les applications
- Industrialiser des modèles statistiques ou d’apprentissage automatique.
- Implémenter le suivi de la validité des modèles statistiques.
- Assurer le suivi de la production et de la maintenance des modèles.
Suivi des projets de développement
- Établir les spécifications techniques en analysant les besoins.
- Reporter les activités au chef de projet.
Activités facultatives
- Automatiser la création de tableaux de bord pour les équipes métiers (envoi de fichiers via des applications dédiées).
- Effectuer une veille technologique sur les outils de Big Data.
- Rédiger la documentation des bases de données (règles de gestion, dictionnaire des variables, etc.).
Variabilité des activités
Les ingénieur(e)s en gestion des données ont la possibilité de se spécialiser techniquement, bien que ce ne soit pas la majorité des cas. Les domaines de spécialisation peuvent inclure l’intelligence artificielle (auquel cas, les ingénieur(e)s en gestion des données qui se concentrent sur l’industrialisation de tels modèles sont appelé(e)s ingénieur(e)s en apprentissage automatique) ou les techniques de flux en temps réel. En ce qui concerne l’industrialisation de modèles d’apprentissage automatique, il est nécessaire d’avoir des connaissances en statistiques et en mathématiques.
De plus, en raison de leurs compétences dans la manipulation des données et parfois dans les statistiques, les ingénieur(e)s en gestion des données peuvent être amené(e)s à intervenir dans le traitement des données lorsque l’entreprise qui les recrute ne possède pas de compétences en science des données. De même, ils/elles peuvent également être chargé(e)s de cartographier et de documenter les données disponibles lorsque cette tâche n’est pas prise en charge par une équipe de gestion de projet. C’est d’ailleurs très souvent le cas pour les petites entreprises et/ou les entreprises moins matures dans la mise en place d’une organisation axée sur les données.
Les entreprises n’embauchent pas toujours d’ingénieur(e)s en gestion des données en interne. Un certain nombre d’entre eux/elles sont recruté(e)s par le biais de sociétés de services et doivent donc pouvoir s’adapter rapidement aux contextes de travail dans lesquels ils/elles interviennent pour mener à bien leurs missions. Dans ce cas, ils/elles peuvent également être en contact direct avec des commerciaux afin d’ajuster les coûts et les délais de livraison de leurs interventions.
Rattachement hiérarchique
- Chef de projet data
- Responsable d’équipe data
- Chef de projet informatique
- Architecte Big Data
Contexte et évolution du métier
Aujourd’hui, avec l’afflux massif de données, les entreprises, quel que soit leur secteur d’activité, ont de nouvelles opportunités à exploiter. Les données sont indispensables pour piloter la satisfaction client, les services après-vente et la gestion des fraudes. L’installation de capteurs de plus en plus courante dans les outils de production permet également de prédire les pannes ou d’automatiser les processus industriels. Certaines entreprises se tournent vers des organisations dites “data-centric”, avec la création d’équipes dédiées et la valorisation de la culture des données.
Les ingénieur(e)s en gestion des données sont confronté(e)s à de nombreuses évolutions technologiques, ce qui exige une adaptation constante, une formation continue et la capacité à travailler avec de nouveaux outils.