Devenir Data Scientist peut être une excellente opportunité pour toutes personnes passionnées par les données et la résolution de problèmes complexes. Le Data Scientist est le professionnel qui va donner de la valeur à la donnée d’une entreprise. Le métier de Data Scientist est vraiment transverse, que vous souhaitiez devenir Data Scientist Freelance ou non. Alors, les missions sont donc variées.
Quel est le salaire d’un Data Scientist ?
Ce métier en également en perpétuel évolution. le salaire de cet expert en data science est aussi une bonne raison de se pencher vers ces métiers :
- Un Data Scientist Junior gagne en moyenne entre 36.000 et 42.000€.
- Une Data Scientist avec une expérience de plus de 4 ans gagne en moyenne entre 38.000 et 45.000€.
- Un Data Scientist Senior va gagner en moyenne entre 54.000 et 65.000€ / an (sans compter les primes).
Le salaire d’un Data Scientist dépend selon le pays, la ville etc. Sachez qu’un Data Scientist senior peut gagner au delà de 65.000€, et peut atteindre un salaire moyen jusqu’à 80.000€/an selon les compétences, les connaissances, l’entreprise, et tout autres conditions à prendre en compte.
Pourquoi créer un portfolio de projets ?
Avoir un portfolio de projet montre que vous avez l’expérience nécessaire pour devenir expert dans la data science. Imaginez que deux Data Scientists Juniors arrivent devant un recruteur.
-> Le premier : “Je connais Python, le Machine Learning, la gestion de base de données”
-> Le second : “Je connais Python, le Machine Learning et la gestion de base de données et d’ailleurs j’ai appliqué ces connaissances dans ce projet où j’ai pu appliquer un réseau de neurones sur des données collectées en Open Data sur ce site.”
À votre avis, sur quel candidat le recruteur va-t-il s’attarder le plus ?
Vous pouvez mettre en valeur des expériences beaucoup plus facilement via votre portfolio et peser dans la balance face à des recruteurs. Ceci se justifie d’autant plus si les projets menés sont en lien avec l’industrie dans laquelle l’entreprise se trouve. Par exemple, si vous postulez pour une banque et que vous avez travaillé sur un projet de fraude bancaire en Machine Learning. Cela prouve que vous vous intéressez aux problématiques auxquelles l’entreprise peut faire face, mais aussi que vous avez une certaine connaissance métier.
Les projets assoient aussi votre légitimité en tant que Data Scientist. Plus vous avez un portfolio varié, plus vous prouverez votre capacité à vous adapter, capacité recherchée, pas seulement en Data Science.
Comment créer votre portfolio ?
Trouvez un projet en data science qui vous intéresse
Se créer un portfolio n’est pas chose facile mais ce n’est pas insurmontable, au contraire ! Le meilleur moyen de commencer est de trouver un secteur qui vous intéresse.
Où trouver les données ?
Une question que l’on pose souvent est : “Où est ce qu’on peut trouver des données pertinentes pour mon projet ? ” Il existe à cette fin des ressources fiables sur lesquelles se reposer.
L’Open Data
Beaucoup d’entreprises mettent leurs données à disposition pour les personnes curieuses de les analyser. Les gouvernements et les universités sont d’ailleurs souvent les premiers à le faire. Voici une liste que vous pouvez commencer à regarder :
- Opendata.paris.fr
- Data.gouv.fr
- Enigma.com
- Snap.stanford.edu
- Opendata.cityofnewyork.us
Ou alors si vous souhaitez regarder directement sur un portail Open Data
- Opendatasoft.fr
Avant de tarir ces sources de données, vous aurez de quoi achever plusieurs projets.
Kaggle
Kaggle est une plateforme de Machine Learning où les Data Scientists du monde entier viennent analyser les données qui sont mises à disposition : pour ceux qui souhaitent mettre en place leurs algorithmes.
Les erreurs à ne pas commettre
Prendre des Datasets trop communs
Même si avoir des projets va vous servir, il faut savoir cibler. Certains projets sont en effet tellement vus et revus qu’il est préférable de ne pas les mettre dans votre portfolio. Parmi eux :
- Le titanic
- La base de données Iris
Ces deux bases de données sont très bien pour commencer à faire vos armes, mais rien ne sert de les ajouter dans votre portfolio comme un projet personnel.
Les personnes qui vont regarder votre portfolio vont, au mieux, penser que votre profil est très junior.
Ne pas améliorer vos projets data
Une autre erreur est de penser que vous ne pouvez pas améliorer vos projets une fois que vous les avez terminés. L’élaboration d’un projet est un processus itératif, il est très bien de revenir dessus et de les améliorer en permanence. Par exemple, il est tout à fait possible que vous ayez appliqué un algorithme X ou que vous ayez nettoyé vos données d’une manière Y, et que vous décidiez de changer de méthode pour améliorer les performances de votre modèle. Vous pouvez alors tout à fait créer une nouvelle partie dans votre projet et exposer vos trouvailles.
Ne pas communiquer sur vos projets
Faire des projets, c’est bien mais que les autres puissent les voir, c’est mieux. C’est pour cela qu’il est bon de communiquer sur vos projets, et faire en sorte qu’ils soient visibles aux yeux du plus grand nombre.
Les réseaux sociaux
Un moyen efficace de relayer vos projets est d’utiliser les réseaux sociaux. Créez vous un compte Github et Kaggle et commencer à poster vos projets là dessus. Dans Github, il est important que chacun de vos projets comporte un fichier README.md que vos utilisateurs puissent facilement lire. C’est souvent une chose qui est oublié parmi les codeurs et qui est pourtant crucial. Si vous n’avez pas de README.md, il est beaucoup plus difficile pour le lecteur de comprendre le sujet du projet.
On vous conseil le guide officiel de Github pour ceux qui commencent dans ce domaine !
Kaggle
fonctionne de la même manière. Il faudra avoir un kernel qui explique dans le détail les tenants et aboutissants de votre projet pour que cela puisse être intelligible pour le plus grand nombre. Vous pouvez aussi utiliser LinkedIn et publier votre projet sous forme d’article. C’est un très bon moyen de gagner en visibilité car tous vos contacts et toutes les personnes qui visitent votre profil vont pouvoir lire les articles que vous avez écrit.
Blog
Avoir un blog ou un site personnel est aussi très bien pour centraliser vos projets. D’autant plus qu’il est très facile de mettre en place un site web sans dépenser un budget énorme. WordPress est un très bon début, ou vous pouvez même utiliser un CMS comme Strikingly ou Wix qui feront très bien l’affaire. Si vous vous amusez à améliorer votre SEO, vous pourrez même apparaître assez haut dans les recherches Google. En plus de votre blog personnel, il y a des plateformes de blogging comme Medium ou Quora que vous pouvez utiliser pour publier vos articles de blog.
Ajoutez des projets à vos CV
Vous pouvez tout à fait valoriser vos projets sur votre CV comme une expérience ou dans une section “projet”.
C’est une très bonne façon d’attirer l’oeil d’un recruteur et de pouvoir ensuite diriger la conversation pour que vous puissiez développer.
Avoir des projets sur lesquels vous avez travaillé est ce qui va vous différencier d’un Data Scientist lambda, passez donc du temps à les peaufiner car c’est ce qui va vous permettre de vous créer de belles opportunités.
N’hésitez pas à poser vos questions ou vos remarques en commentaires de l’article ! Si vous êtes intéressé à l’idée d’apprendre les Data Sciences et d’avoir tous les conseils carrière de notre Talent Manager, vous pouvez regarder notre site Jedha.co !
Questions fréquentes
Est-il possible de devenir Data Scientist à 40 ans ?
Oui, il est bien évidemment possible de devenir Data Scientist à 40 ans (même après). Votre âge ne va pas vous impacter dans votre souhait de devenir Data Scientist. Le plus important, c’est d’avoir les compétences et les connaissances requises pour ce métier.
Quel est le salaire moyen d’un Data Scientist en France ?
Le salaire moyen d’un Data Scientist en France est d’environ 60 000 à 80 000 euros par an.