Big Data : préparez le déluge !

Arche de Noé

Dans notre précédent billet, nous évoquions la « data agility » comme levier de réussite pour la conduite d’un projet Big Data.

Si cela reste notre conviction, il n’est pas rare de lire dans la presse spécialisée SI (exemple du sondage CRIP autour du Big Data) que l’un des principaux freins à la réussite d’un projet demeure l’insuffisance de compétences au sein des DSI.

Ayant en mémoire un autre article, paru il y a quelques mois, qui abordait de manière humoristique cette problématique, force est de constater que la question des compétences nécessaires à la réussite d’un projet Big Data est un sujet récurrent.

Alors en temps qu’animateur de projet, si vous deviez, tel Noé, n’embarquer que quelques personnes pour une aventure sur le « grand lac de données » qui devriez-vous choisir ? S’il faut effectivement des compétences techniques (probablement un peu rares en regard de l’engouement récent pour le Big Data), il faut également des compétences métier. Nous vous conseillons donc d’embarquer avec vous les 6 rôles suivants.

Un narrateur sera un élément clé pour faciliter l’adhésion au projet. Par ses qualités de communicant et ses talents d’orateur, il saura porter la conviction au niveau des directions métier, communiquer sur le résultat des études, et convaincre le top Management. Il doit aussi avoir une forte appétence pour les données et très bien les comprendre pour en saisir la complexité et les limites. Le narrateur peut être interne ou externe, côté DSI ou métier, tant qu’il est à l’aise pour animer et communiquer.

La construction du modèle de données doit s’appuyer sur un expert en modélisation. Cet acteur connait et comprend l’entreprise dans sa vision dynamique (produit ou processus) et dans sa vision statique (modèle des objets métiers). Il est le gardien du temple pour les définitions et les règles métiers. Cette compétence est détenue généralement dans les pôles architectures, du côté des architectes de données ou des urbanistes. Interne ou externe, il faut surtout éviter de reproduire les modèles historiques et apporter de la généricité et de l’évolutivité.

Un ingénieur en technologie Big Data appuiera l’équipe dans le choix des outils existants, pour cibler et implémenter ceux qui répondent le mieux au besoin et à l’environnement. En fonction de son profil et de l’ampleur du projet, il devra être accompagné de développeurs pour construire le système. Ces compétences n’existent encore que peu en interne et si beaucoup de SSI se positionnent sur le marché, c’est souvent du côté des PME et startups que l’on trouve les meilleurs profils.

Il y a « the man in the shadow » (en référence au « data shadow » du précédent billet). Expert de la donnée, il les connait bien car il les manipule depuis des années avec ses outils bureautiques (fonctions d’extraction de données des applications, Access, Excel pour les interpréter, messagerie pour les échanger…). Il apportera une compétence fondamentale sur la valeur des données de l’entreprise. C’est une ressource interne par excellence, à chercher, par exemple, du côté des services financiers, marketing, ou statistiques si il existe.

Le datascientist est celui qui va créer l’inspiration et générer des idées en manipulant les données à la recherche de corrélations intéressantes (nous vous renvoyons à un de nos précédents billets pour notre vision du datascientist). Il s’appuiera sur les sachants métier, l’expert en modélisation et « the man in the shadow » pour valider son analyse des données et utiliser les bonnes sources internes à l’entreprise.

Beaucoup de projets se retrouvent bloqués par un manque de données, soit parce que le processus qui les génère n’est pas instrumenté, soit parce que l’entreprise ne les possède pas, tout simplement. Les deux derniers acteurs précités vont devoir investiguer pour résoudre cette difficulté. Ils rendront un service inestimable en remettant constamment en question le reste de l’équipe et les autres parties de la société qui pourraient fournir ces fameuses données (référence aux éternels silos métiers). Mais ils seront parfois légalement « borderline » car ne se soucieront pas toujours des conséquences (respect de la vie privée, informations commercialement sensibles…).

Un déontologue viendra donc compléter cette liste. Au plus près des équipes pour poser les questions de confidentialité sur les données et les cas d’usages, ses compétences permettront d’éviter des ennuis avec les autorités mais également avec les clients. Car l’écart est grand entre ce qui est techniquement légal et ce que les utilisateurs sont prêts à accepter. Il aidera l’équipe à trouver le juste équilibre. De récentes études prouvent que les entreprises ont tendance à prendre plus de mesures conservatrices quand elles n’ont pas accès à des conseils de qualité sur ce qu’elles peuvent faire ou non, par peur de transgresser accidentellement une loi. Des cabinets se spécialisent de plus en plus dans cette mission, ou s’associent pour offrir une couverture complète de la chaine de la donnée.

En guise de conclusion et avant de se voir opposer la carte de la disponibilité des ressources, nous parlons bien ici de compétences. Certains profils peuvent donc posséder plusieurs compétences et cumuler les rôles. Et, bien sûr, ce ne sont pas des rôles à temps plein. Ils n’interviennent parfois que ponctuellement mais toujours au juste moment. Nous avons, par nos expériences passées, acquis une certaine visibilité sur les charges associées en fonction des projets et nous les partagerons avec plaisir avec vous.

Auteure : Delphine BARRAU

data - Observatoire CONIX de la Donnée

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *