Data Scientist : petit super-héros deviendra grand

Data scientist hero

Data scientist, un nouveau métier ?

Que pensez-vous de l’affirmation suivante : « le data scientist n’est pas un nouveau métier, on l’appelle mathématicien dans les universités, scientifique à la NASA, statisticien à l’INSEE, actuaire dans l’Assurance, quant à la Banque » ?

Beaucoup ne veulent pas entendre dire que le data scientist est le nouveau nom du statisticien (ou de l’actuaire…) et je suis d’accord même si j’ai rencontré des statisticiens « nouvelle génération », très habiles avec les technologies et les langages Big Data et tout à fait aptes à devenir des data scientists, si leur passion de la statistique se transforme en passion de la compréhension du monde.

Car ce qui fait la nouveauté de ce métier ce sont les volumes, les outils mais également les données manipulées et leur diversité : demandez à un quant de faire des analyses de sentiments sur Twitter !

Le data scientist est un hybride entre un mathématicien, un statisticien, un développeur, un « business analyst » et un communicant. C’est un super héros mais pas pour autant un magicien ! Il gère des mégadonnées de natures diverses tout en passant de la culture de l’échantillon à la culture de l’ensemble et s’intéresse viscéralement au métier sur lequel portent ses analyses.

Je défends l’idée que le data scientist est né de la rencontre d’un (ou d’une) scientifique passionné par les données avec une révolution technologique qui ouvre toutes les portes du possible.

Que pourra faire pour vous un data scientist ?

Maintenant que la connaissance des données est un axe fort pour tous les secteurs d’activités, que les gros volumes de données structurées ou non sont monnaies courantes dans les entreprises et que les technologies Big Data se sont démocratisées, toutes les entreprises peuvent prétendre à employer une équipe de data scientists. Et ce métier trouve son application partout : banque, assurance, mutuelle, marketing, énergie, grande distribution, industrie pharmaceutique, secteur public… et même politique (cf l’article Gouvernement des algorithmes sur le Blog d’Henri Verdier, administrateur général des données de l’Etat).

Le data scientist mène des projets Big Data. Il peut s’agir de projets destinés à clarifier les données de l’entreprise (classification, vision 360…), expliquer des phénomènes ou des comportements (désabonnement, fraude…) ou, tout simplement, s’atteler à découvrir les moyens d’améliorer les produits ou les services offerts par l’entreprise.

Vous avez peut-être déjà lu la définition imagée proposée par Monica ROGATI (Linkedin) : le data scientist « est la rencontre de Christophe Colomb et de l’inspecteur Colombo : les yeux éclairés d’un explorateur et la perspicacité d’un détective ».

Le data scientist cherche à comprendre le métier dans lequel il évolue. Puis à comprendre les données, en les préparant, les explorant et les recoupant avec plusieurs sources, internes mais également externes qu’il doit trouver. Enfin il les analyse et leurs applique des modèles prédictifs puis évalue et effectue des recommandations pour améliorer l’objet de son étude.

Quelles sont les compétences d’un data scientist ?

Un data scientist doit avoir une forte appétence pour les données, tout autant que pour les technologies, les langages et les outils informatiques, maîtriser les techniques d’analyse de données et les méthodologies statistiques. Mais il doit aussi être expert dans la compréhension et l’interprétation des données et détenir un bon savoir-faire dans le secteur d’application des données analysées.

Son éthique – voire quelques compétences juridiques – lui permettront d’éviter un usage « extrême » des données manipulées tandis que son savoir rhétorique mettra en lumière les résultats de son analyse.

Il existe deux types de profil aujourd’hui sur le marché : d’une part, de jeunes data scientists fraichement sortis d’écoles, curieux, imaginatifs et très pointus dans les nouvelles technologies sans avoir réellement beaucoup manipulé, sauf peut-être pour les plus passionnés qui « jouent » sur des plates-formes mondiales de data science (cf. Kaggle ou datascience). Et d’autre part, des « reconvertis » plus séniors qui, passionnés par la data depuis déjà des années, ont évolué, en autodidacte ou en suivant des cursus spécialisés, vers le métier de data scientist. Ils sont (parfois) moins experts en nouvelles technologies mais ont plus de recul sur l’écosystème de la donnée (gouvernance, qualité, architecture, accessibilité..), la conduite de projet et les ficelles de la « business analyse ».

Comment le recruter et le garder ?

Ne cherchez pas pour autant le mouton à 17 pattes ! Votre besoin dépendra de votre ambition et votre maturité dans vos projets Big Data. Un jeune data scientist mal accompagné peinera à comprendre les données de l’entreprise et donc à les analyser, tandis qu’un data scientist en chef aura moins d’appétence à programmer mais saura mieux gérer le portefeuille de besoins.

Je conseille d’embaucher un data scientist junior pour intégrer une équipe ou de recruter un data scientist en chef pour piloter une équipe.

Les formations n’ont pas encore atteint une forte maturité. Depuis la rentrée 2014, certaines écoles d’ingénieurs proposent des masters 2 ou masters spécialisés en data science (par exemple Polytechnique et Telecom Paris) ou ont adapté leur cursus existant (notamment des écoles de statistiques comme l’ENSAE, l’ENSAI, Paris Tech, Polytech Lille). Il existe aussi des certificats ou formation diplomantes professionnelles (cf CEPE ou MBA).

Le data scientist se recrute sur linkedin, Viadéo et autres sites (mais il faut connaitre les bons mots-clés) ou, en prestation, dans des cabinets de conseils spécialisés en Data Science (encore assez rares), en Transformation digitale ou en Innovation.

En plus d’être souvent jeune et pointu, le ou la data scientist (car c’est un métier assez féminin) pourrait avoir la grosse tête à force d’entendre qu’il fait « le métier le plus sexy du monde » et qu’il est très recherché. Alors comment manager « une star » et tout mettre en œuvre pour le retenir quand, enfin, vous avez réussi à trouver la perle rare ?

Il emploie un vocabulaire que vous ne maîtrisez pas : il parle de données labellisées, enrichies, d’apprentissage supervisé, de clustering, d’analyses prédictives, de régresseurs, classifieurs, data visualisation… Mais il parle aussi et avant tout usages et sens métier.

Il faut savoir satisfaire sa curiosité, sa soif de découverte, veiller à ce qu’il ne s’ennuie jamais et lui laisser suffisamment d’autonomie pour qu’il laisse parler les données. Rien n’est plus frustrant pour un data scientist que de ne pas faire de data Science surtout quand il lit chaque jour dans la presse qu’il en manque partout. Evaluez-le par les résultats, donnez lui du grain à moudre et les moyens pour le moudre.

C’est un curieux, un passionné qui a envie de partager sa passion. Ne l’isolez pas, ce n’est pas un « geek » à laisser derrière un PC. C’est un collaborateur qui partagera ses analyses au travers de visualisation parlantes et adaptées à son audience.

Où positionner un data scientist dans l’organisation ?

Il occupe des postes et des compétences à grande transversalité dans l’entreprise car il collabore autant avec des informaticiens que des experts métiers, et s’adresse aussi bien à la maîtrise d’œuvre pour accéder aux données, qu’au top management, pour exposer ses résultats. Il peut donc être positionné partout. Tout est ensuite un choix de stratégie interne.

DSI, Direction marketing, DAF ? La question sera plutôt « qui manage les projets Big Data dans l’entreprise ? » Et là sera bien positionné le data scientist.

L’intérêt de l’intégrer dans une DSI ou, mieux encore, dans une structure dédiée à l’innovation est d’utiliser ses compétences pour plusieurs métiers et ne pas le limiter à un silo de l’organisation.

Pour conclure, en deux avis très personnels,

Le data scientist est effectivement une ressource rare dont la pénurie risque d’augmenter avec les besoins croissants mais le potentiel de développement est important en France (il suffit de voir le palmarès de ces fameuses plates-formes mondiales de data science). Sachez identifier les collaborateurs prêts à franchir le pas et proposez-leur une évolution vers ce métier. N’hésitez pas à vous faire accompagner ou à mener des partenariats avec des structures qui ont ces compétences.

Enfin il me semble évident que rien ne sert d’avoir une superbe infrastructure et une armée de data scientists si vous ne savez que faire de vos données et comment y accéder. Commencez humblement, construisez un bac à sable et/ou un laboratoire (datalab), puis laissez parler vos données et s’épanouir vos data scientists. Les grandes révolutions viendront ensuite (presque) d’elles-mêmes !

data scientist - Observatoire CONIX de la Donnée

Auteur : Delphine BARRAU – Illustration © yuryimaging – Fotolia.com

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *