Une nouvelle expérience Data Science pour CONIX : allier talents et gouvernance

Une nouvelle expérience Data Science pour CONIX : Allier talents et gouvernance

Si notre réussite honorable au challenge AXA nous a permis de tirer de premiers enseignements concrets sur le profil du Data Scientist, notre accompagnement d’un grand client de l’Energie confirme la nécessaire combinaison de la data science et de la gouvernance.

Le projet

La construction de ce projet d’analyse de données réunit des éléments de BIG DATA (plusieurs millions de données), de DATAVIZ (restitution visuelle pour l’aide à la décision) et d’OPEN DATA (des données internes enrichies par des données externes puis ouvertes au sein d’une communauté d’intérêt).

Il se découpe en quatre phases rejouées périodiquement :

  • Capter la donnée de manière automatique ;
  • Mettre en qualité cette donnée et l’enrichir avec des données externes issues entre autres de l’INSEE (population) ;
  • Analyser cette donnée en mettant en œuvre des algorithmes mathématiques évolués (dans notre cas des modèles combinatoires sous contraintes) ;
  • Restituer l’information d’une manière visuelle et graphique pour aider à la décision.

La confirmation des premières convictions

La réalisation en quelques jours d’une maquette pour ce projet en utilisant les outils disponibles au « laboratoire de données » nous a confortés dans nos convictions.

La création d’un laboratoire de données outillé même en mode « bac à sable » permet de monter rapidement des solutions opérationnelles répondant à des besoins métiers.

Si toutes les organisations ne disposent pas d’un super héros en data science, la combinaison des talents est un bon compromis : celui (ou celle) qui connait les données, leurs valeurs et leurs sens, celui qui manipule les données et interviendra dans les phases amont de préparation, de croisement, d’enrichissement et de mise en qualité des données, celui qui met en œuvre le moteur d’analyse des données et enfin celui qui travaille le design de l’outil final afin de fournir un outil visuellement parlant et représentatif pour le métier.

L’existence d’un laboratoire ouvert, de compétences en place et l’utilisation des outils libres (tels que R Studio ou HUE) ou le recours aux solutions de startups montantes permettent également de réduire les coûts de mise en œuvre.

Un laboratoire efficace

Mais si ces composants sont nécessaires pour conduire un projet, les clés de la réussite d’un laboratoire ne se limitent pas à des outils et des talents, ne serait-ce que pour répondre à quelques questions élémentaires :

  • Comment capter les cas d’usages ?
  • Comment dimensionner son laboratoire pour être en mesure de répondre à toutes les demandes ?
  • Comment industrialiser le résultat d’un POC sans perdre des mois ?
  • Comment piloter et manager une équipe aux talents aussi divers ?
  • Etc …

La réussite d’un laboratoire c’est aussi et peut-être avant tout une gouvernance maitrisée, des process définis, une animation continue, un bon staffing, sans oublier une rotation des compétences pour éviter les dérives :

  • Mettre en place un catalogue piloté des questions métiers soumises (via un réseau informel de correspondants, une communication interne ou externe, une écoute permanente, des suggestions DSI…) pour capter les besoins.
  • S’appuyer sur un comité de coordination des données pour sélectionner et prioriser les usages en fonction des données disponibles ou de leur coût d’extraction, de leur niveau de qualité par rapport à l’usage souhaité et du retour sur investissement (est-on dans une étude « One Shot », ex : adaptation d’offres, ou dans un maquettage avant industrialisation, ex : moteur de maintenance prédictive ?). (Savoir abandonner)
  • Assurer un pilotage transverse pour connaitre les données de l’entreprise (sensibilité, valeur, qualité), filtrer les données utiles et riches de sens et faciliter la création de nouveaux usages. (« In God we trust. All others must bring data » Deming)
  • Penser architecture transverse pour répondre notamment aux questions autour de l’architecture des données et du Cloud (autant pour le stockage des données que pour les capacités de calcul) et pour pérenniser les solutions opérationnelles. (Oser et Innover)
  • Enfin, manager les talents pour organiser et animer la pluralité des compétences, avec une bonne vision de l’état de l’art et le recours à des formations qui préparent de façon opérationnelle à la data science, telles que celle du centre de formation continue de l’ENSAE (Certificat « Data Science »).

CONIX vous accompagne

En conclusion, pour garantir la réussite des projets dans un laboratoire de données, ce dernier doit porter une offre complète.

Par nos expériences passées en conduite de projets et gestion des données, notre connaissance intime des métiers de ses clients, notre implication et notre compétence en terme d’innovation digitale et depuis peu notre investissement dans la datascience, nous sommes aujourd’hui en mesure de vous accompagner dans la mise en œuvre efficiente de votre laboratoire de données.

laboratoire - Observatoire CONIX de la Donnée

Auteur : Delphine Barrau

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *