Archives du mot-clé conix

Guide pratique de data lineage – Procédé Praxeme – « Assurer la traçabilité des données » dans une démarche d’architecture d’entreprise

Nous avons le plaisir de vous annoncer une nouvelle contribution CONIX à la méthode Praxeme.

Cette contribution est un procédé de data lineage.

Ce procédé :

  • Offre un guide pratique pour réaliser un data lineage (pourquoi, comment, quoi – résultat)
  • Met ce type d’exercice dans la perspective plus large de traçabilité sur les données (traces de construction : comment est la chaîne de traitement des données, traces d’exécution : comment s’exécute la chaîne de traitement des données)
  • Offre une typologie des méta-données à recueillir et illustre différentes façons de les représenter
  • Décrit les 7 étapes de production d’un data lineage
  • S’inscrit dans une démarche d’architecture d’entreprise permettant d’avoir une vision d’ensemble, alignée et exhaustive d’un data lineage (choix de modélisation alignés entre le modèle métier et les modèles d’implémentation physique des données, lien avec la gouvernance des données, méta-données alignées sur les différents aspects au sens Praxeme d’une architecture d’entreprise)
  • Comprend des illustrations d’usages de data lineage : dans le cadre réglementaire bancaire (BCBS), RGPD et qualité des données
  • Ouvre vers l’idée de conception des systèmes selon une approche « trace by design ».

Lien : http://www.praxeme.org/data-lineage-assurer-la-tracabilite-des-donnees/

La datavisualisation

Nous sommes envahis par un grand nombre de données que notre cerveau ne peut exploiter et analyser simultanément. Face à cela, la datavisualisation fait parler d’elle comme une alternative et un moyen pertinent de mettre en valeur la donnée.

Si le concept de datavisualisation existe depuis longtemps, la révolution Big Data lui a donné un nouveau souffle. Immersion dans la datavisualisation, cette science qui donne la parole aux chiffres :

  1. Qu’est-ce que la datavisualisation ?

L’expression « une image vaut mille mots » prend tout son sens lorsqu’on réalise que 90 % de l’information transmise au cerveau est visuelle. La data visualisation utilise cette sensibilité à l’aspect visuel pour faire passer des informations qui sont, de prime abord, complexes.

Désignée comme l’art de transformer la data en représentations visuelles, la datavisualisation fait parler les chiffres et leur donne une signification. Plus encore, elle permet d’aborder des informations sous un autre angle, pour mettre en lumière des faits et des réalités qui ne sont pas toujours visibles au premier abord.

L’esthétique joue un rôle important puisque les données sont retranscrites sous forme d’objets visuels tels que des graphiques, des cartographies, des chronologies ou des mappings.

Considérée comme un outil de communication puissant et efficace, elle permet également un gain de temps conséquent dans l’analyse et la recherche de données.

  1. Un outil stratégique de Business Intelligence

La Business Intelligence, désigne toutes les solutions qui mettent à disposition des informations clés aux managers grâce au traitement, à l’analyse et la représentation des données. Ces solutions incluent la datavisualisation.

Dans leur transition vers des organisations « data-driven », les managers et les décisionnaires s’appuient sur la datavisualisation comme outil stratégique dans la gestion de leur entreprise. La datavisualisation utilise le big data comme une solution opérationnelle dans le processus des prises de décisions en entreprise.

Les interminables tableaux Excel laissent place aux tableaux de bord fonctionnels, interactifs, personnalisés et actualisés en temps réel. Les managers y retrouvent les principaux KPIs et drivers qui leur sont utiles pour analyser leur activité. La visualisation interactive permet l’exploration des données en profondeur et également de jouer sur tous les paramètres visuels (couleurs, taille, positionnement dans l’espace…) pour démarquer les différents secteurs d’activités et KPIs.

En un coup d’œil, le décisionnaire obtient une vue d’ensemble qui lui permet de comprendre le contexte global de la situation, lui offrant à la fois un gain de temps et une évolution de sa productivité.

Envie d’en savoir plus sur les solutions de datavisualisation ? Contactez-nous

Quoi de neuf dans les métiers du conseil cloud ?

Depuis 2 ans, CONIX est membre de l’association EuroCloud France.

En tant que Cloud Practice Manager, j’ai l’honneur d’en être le représentant pour le Groupe CONIX. Je travaille plus particulièrement au sein de la Commission Conseils. Depuis sa création, la Commission Conseils d’EuroCloud France s’est interrogée sur les impacts et les enjeux du Cloud Computing sur l’activité de Conseil. Avec une classique analyse de type SWOT (Forces – Faiblesses – Opportunités – Menaces), la première question en 2014 avait été centrée sur la perception du Cloud par les cabinets de Conseil : menace ou opportunité ? L’étude, résumée dans le premier Livre Blanc de la Commission Conseils, avait fait apparaître le Cloud comme une opportunité dans tous les cas de figure.

En 2015, après avoir mis en lumière que les éléments de la satisfaction des clients sont les facteurs clés de succès du Conseil Cloud, la Commission s’était interrogée sur la problématique de « Comment mieux conseiller ses clients ? ». Plus de 30 % des cabinets avaient alors remis en cause le modèle classique en présentant de nouvelles approches de Conseil : conseil des intégrateurs et revendeurs spécialisés (notamment sur des offres technologiques spécifiques), conseil en courtage de services Cloud, conseil online, etc…

En 2016, une nouvelle étude a été réalisée par la Commission Conseils d’EuroCloud afin de mieux comprendre les évolutions du métier du conseil, avec l’arrivée en force du Cloud Computing privé ou public dans les entreprises. Cette année, la Commission Conseils a ainsi étudié les trois grandes typologies de Conseil contribuant chacune au déploiement des usages apportés par le Cloud Computing :

  1. du conseil des grands cabinets historiques : le Conseil Cloud généraliste ;
  2. aux sociétés spécialisées sur des technologies : le Conseil Cloud spécialiste ;
  3. en passant par les « pure players » novateurs du Cloud : le Conseil Cloud 2.0.

Afin de pouvoir comparer ces 3 types de Conseil, une analyse complète autour de 3 portraits robots a été établie, présentant pour chacun : les spécificités, les clients, les enjeux, les conseils types, les commanditaires, la tarification, la valeur ajoutée, les méthodologies, les compétences, les partenariats et l’organisation.

Tout ce travail a été effectué sur la base d’interviews de nombreux acteurs du marché (avec l’aide des étudiants du mastère spécialisé « Expert Cloud Computing et SaaS » de l’école d’ingénieurs ISEP – Institut Supérieur d’Electronique de Paris), depuis de grands cabinets de conseil en place à l’international jusqu’à des structures plus modestes mais très innovantes.

Le Groupe CONIX, de par ses 5 pôles d’expertise (Solutions Digitales, Business Intelligence, Cybersécurité, Transformation & Innovation et Risque & Réglementaire), se situe clairement dans la catégorie des cabinets de conseil généraliste, néanmoins agile car à taille humaine (environ 210 collaborateurs). A ce titre, nous conseillons nos clients afin qu’ils utilisent le Cloud dans le cadre de leur Transformation Numérique, comme levier d’agilité et d’économie, dans une logique « as a Service » chaque fois que cela est possible (infrastructure, plate-forme, solution, etc.)

Le Livre Blanc 2016 de la Commission Conseils d’EuroCloud France est disponible en libre téléchargement >> ICI << (fichier PDF, 240 ko).

Auteur : Hervé HUSSON

Projet Epidemium : CONIX récompensée dans la lutte contre le cancer

Projet ELSE

Le Projet Epidemium

Samedi 28 mai, se déroulait la finale du projet Epidemium, Challenge4Cancer, organisé par le laboratoire de recherche La Paillasse en partenariat avec les laboratoires Roche, et animé par le collectif Epidemium. Une soirée pleine d’émotions et de surprises pour l’équipe de CONIX qui participait au challenge.

Mais revenons 6 mois en arrière…

Dans le but d’innover et de faciliter les recherches scientifiques sur le cancer, les laboratoires Roche et La Paillasse lancent fin 2015 le projet Epidemium, programme de recherche scientifique participatif et ouvert dédié à la compréhension du cancer grâce aux Big Data. Il qui prend la forme d’un data challenge, Challenge4Cancer. 21 000 jeux de données ouvertes sont mis à disposition par les organisateurs.

25 équipes se lancent dans l’aventure, dont CONIX avec son projet ELSE (Evolutive Life Selection Experience). Il s’agit de créer une expérience interactive et sensibilisante, sous forme d’un « Serious Game » : dans la peau d’un personnage né en 2000, le joueur sera sensibilisé aux facteurs de risques liés aux cancers susceptibles de l’affecter, lui ou ses proches, en fonction des habitudes de vie.

ELSE combine un socle scientifique de traitement de données par des modèles prédictifs avec une application simple, type jeu de plateau. Réalisé en mode Agile avec 6 sprints de 3 semaines, la documentation du projet et la répartition des tâches ont été réalisées sous Trello (outil gratuit et visuel d’organisation de projet).

Ce projet a permis de rassembler au sein d’une même équipe les différentes compétences disponibles chez CONIX (architectes Big Data, développeurs, data scientists, data analystes, animateurs…) et de les mettre en œuvre sur tous les axes des BIG DATA (maîtrise d’ouvrage, maîtrise d’œuvre et développement, infrastructures, méthodologie projet).

La communication au sein de l’équipe projet (une vingtaine de personnes) a été assurée par le Réseau Social d’Entreprise de CONIX (Chatter de Salesforce).

Le cœur prédictif a été développé en Python à l’aide du notebook web Jupyter, toujours dans ce souci de travail d’équipe, en testant plusieurs modèles de régression issus de la librairie ScikitLearn. L’application a été développée avec les technologies web du moment : HTML5, jQuery et Bootstrap. Enfin, des tests sur un socle Hadoop, mis en place au sein de CONIX afin de répondre aux attentes de nos clients, ont permis de démontrer la robustesse de notre projet sur un périmètre plus large que la France (entrainant donc une volumétrie de données beaucoup plus conséquente).

Face à un jury exigeant composé d’un comité éthique et d’un comité scientifique auxquels participaient d’éminents spécialistes (dont notamment Cédric VILLANI, médaille Fields en Mathématiques), le projet ELSE s’est vu délivrer la mention spéciale « Originalité du Modèle » ainsi que le 3ème prix. Le chèque de 2000 € remis à CONIX pour ce prix par les Laboratoires Roche sera versé intégralement à la recherche contre le cancer.

Au delà de la grande satisfaction des prix et mentions décernés par le jury, ce challenge a aussi été l’occasion de confirmer la capacité de CONIX à assurer l’exécution d’un projet Big Data et Data Science sur toutes ses étapes et lui permet de renforcer ses retours d’expérience à partager avec ses clients.

Il reste néanmoins encore beaucoup de travail à réaliser pour consolider le modèle, assurer la portabilité de l’application vers des supports mobiles et surtout valider le scénario avec des collectifs d’association de malades, voire avec l’Education Nationale, pour porter le bon message auprès d’une population jeune, à sensibiliser aux facteurs de risques du cancer.

Revue de presse
Makery Info : Epidémium ouvre les mégadonnées du cancer
Roche.fr : Epidemium Challenge4Cancer : « And the winner is… Science ! »

Auteurs : Delphine BARRAU, Elkhader FATNI, Hervé HUSSON

Mise à jour (le 29/06/2016) : le projet ELSE est en ligne, à l’adresse http://www.conix.fr/epidemium/else.html

Contribution PxData
Politique de la donnée – procédé et formalisation

PxData

Définition d’une politique de la donnée

Aucune organisation ne peut ignorer le phénomène Data. La pression par les données devient de plus en plus forte (obligations réglementaires, nouveaux risques liés à l’inflation de la circulation et de l’exposition des données…).  les opportunités offertes par les données explosent (création de business models par l’intégration de services orientés données, enrichissement des données par le sourcing externe…). Les organisations multiplient les initiatives.

Dans ce contexte, comment piloter de manière concertée tout ce qui a trait aux données au sein d’une organisation ? Un élément de réponse est la définition d’une politique de la donnée.

En 2015, dans le cadre de la méthode publique Praxeme, une première version d’un procédé d’élaboration d’une politique de la donnée a été proposée. Ce procédé est le résultat de travaux de la société CONIX avec le support des auteurs de la méthode publique.

Le cœur de la politique est, par essence, le capital « données ». Sur la base de ce capital nous allons décrire les éléments clés support à la politique : définition, sensibilité à l’exposition, réglementaire, règles d’usage…

Praxeme couvre tous les aspects de l’entreprise, de la stratégie au déploiement. Sept aspects sont identifiés dans ce que l’on appelle le « Système Entreprise ». Les données sont présentes dans chacun de ces aspects et la politique de la donnée proposée est donc structurée pour répondre à chacun d’entre eux :

  • Aspect Intentionnel : les valeurs de l’entreprise et ses finalités (stratégie, culture, contraintes…)
    ➜ Déclinaison dans la politique de la donnée : exprimer les intentions liées aux données tout en respectant les valeurs de l’entreprise
  • Aspect Sémantique : la connaissance, les fondamentaux du métier (l’environnement, l’offre de l’entreprise, les objets métier…)
    ➜ Politique de la donnée : assurer la compréhension partagée des données (définition, dictionnaire, modèle sémantique…)
  • Aspect Pragmatique : les activités de l’entreprise et son organisation (rôles, processus, styles de management et de contrôle…)
    ➜ Politique de la donnée : ordonner les activités en vue de l’exploitation optimale des données, mettre en lumière dans les processus existants les impacts de la politique et faire les adaptations nécessaires
  • Aspect Géographique : la localisation des activités de l’entreprise (géographie de l’entreprise, virtualisation, télétravail, équipement nomade…)
    ➜ Politique de la donnée : préciser les dispositions techniques et organisationnelles à prendre quant à la distribution géographique des données
  • Aspect Logique : un aspect intermédiaire entre métier et technologie, introduit dans la chaîne de transformation pour faciliter la conception des systèmes techniques
    ➜ Politique de la donnée : Décrire l’architecture logique de données
  • Aspect Logistique : l’ensemble des ressources techniques au service de l’activité
    ➜ Politique de la donnée : Identifier les composants techniques support à l’architecture de données
  • Aspect Physique : le Système Entreprise complètement déployé (avec toutes ses ressources localisées)
    ➜ Politique de la donnée : Préparer le déploiement de la politique, dimensionner la cible, accompagner le changement

Enfin le dernier point nécessaire à une politique de la donnée est la gouvernance associée. C’est-à-dire l’organisation nécessaire à la maîtrise des données (profils, compétences…), l’inscription dans la « comitologie » existante, l’interaction avec les projets de transformation et trajectoire pour une cohérence transverse à la politique de la donnée et la promotion de la culture de la donnée au sens large pour la bonne mobilisation des collaborateurs.

Le formulaire et le mode d’emploi sont téléchargeables dans le respect de la licence Creative Commons qui régit le fond documentaire Praxeme (documents PxPRD-04f – Politique de la Donnée – et PxPRD-04m – mode d’emploi).

Ce premier travail, finalisé en 2015, a vocation à se poursuivre en 2016 et 2017 pour, en particulier, renforcer l’angle innovation et data science, accompagner la culture de l’expérimentation, développer le caractère auditable de l’application de la politique, explorer la dimension éthique et, enfin, réaliser un état de l’art sur les outils supports d’une politique de la donnée et de sa mise à jour.

Auteurs : Delphine BARRAU & Joël BIZINGRE

politique de la donnée - Observatoire CONIX de la donnée