Archives du mot-clé open data

Data is like gold : you better move it rather than sit on it

Mine d'Or
Il s’agit d’un bien précieux très recherché et apprécié depuis les temps anciens. L’homme a dû apprendre à l’extraire, le raffiner, le transformer, puis le valoriser… avant de finalement l’utiliser en guise de thésaurisation.

Si cette description ne vous éclaire pas sur le sujet dont il est question, c’est bien parce que l’or et la data se confondent facilement aujourd’hui. D’ailleurs, la terminologie employée n’est pas anodine: à l’état « naturel », la data se présente sous une forme aussi brute que celle d’une pépite d’or qu’il convient d’extraire. Le travail de préparation de la donnée brute constitue ainsi près de 70% du temps passé sur un projet Big Data. Et malheureusement, c’est dans cet état primaire que de nombreuses entreprises la conservent indéfiniment. Texte, email, réseaux sociaux, navigation, localisation, météorologie, démographie… les filons sont nombreux mais les prospecteurs de la data n’y ont pas accès. Ce véritable trésor insoupçonné constitue pourtant un atout de poids dans le business d’une entreprise car, contrairement au métal précieux, la pertinence de la donnée décuple lorsqu’elle est corrélée à d’autres sources. Dès lors, on comprend rapidement qu’il ne convient pas de rester assis sur cette montagne de données sans chercher à en tirer profit. Les plateformes open data l’ont bien compris et prolifèrent aujourd’hui sur la toile.

L’open data, c’est un concept simple qui traduit la volonté de mettre l’information à disposition du public. À l’instar de l’Etat avec la plateforme data.gouv.fr qui contient déjà 18500 jeux de données, des grandes agglomérations (Toulouse, Rennes, Issy-les-Moulineaux…), la SNCF, la RATP, ErDF ou encore JC Decaux procèdent au déverrouillage des données. En face, les « sportifs » de la data se challengent lors des datathons, favorisant au passage le raffinage de la donnée. Pourtant, cette démarche d’ouverture ne devrait pas profiter qu’aux grandes entreprises. Ordonner une liste d’hôtels pour maximiser les ventes, ne pas retrouver une housse de portable dans la catégorie smartphone sur un site d’e-commerce ou estimer automatiquement le prix de vente d’un véhicule d’occasion: voici quelques exemples par lesquels des entreprises ont pu dynamiser des données internes en « se contentant » de les publier. Bien sûr, la publication des données peut se faire à différentes échelles et par différents moyens. Il est effectivement possible de débuter au sein de l’entreprise, en regroupant les sources de données variées et de divers formats sur une plateforme telle qu’OpenDataSoft. Dans un second temps, on pourra augmenter sa couverture à de nouveaux départements, filiales… avant de se décider quant à une éventuelle publication sur le web notamment grâce aux API. Deux possibilités sont donc offertes pour favoriser le monde des données ouvertes : Open API ou Open Data. Un même but, une stratégie différente.

Enracinée parmi les fondements de la république, la politique d’ouverture des données est l’un des chantiers numériques de notre siècle. En témoigne la 3ème position de la France au classement mondial de l’Open Data Index (derrière le Royaume-Uni puis le Danemark, décembre 2014). Initialement porté par la recherche puis par le gouvernement, l’open data alimente les possibilités offertes par le big data en se joignant à la production humaine que l’on retrouve déjà sur les réseaux sociaux. En plein essor, il propulse une entreprise classique sur le devant de la scène car ouvrir ses données vers l’extérieur promet de développer de nouveaux usages autour de son métier historique tout en participant au développement économique. Le déploiement des compteurs communicants dans le secteur énergétique, associé aux futures smart grids, en sont une illustration. Les frontières doivent cependant être clairement définies lorsqu’on abordera des données personnelles, car développer un business autour de cette matière première, à l’image des GAFA (Google, Apple, Facebook, Amazon), ne s’improvise pas.

The Gold Rush

Le choix de politique d’ouverture des données appartient à chacun. Si la démarche semble échapper au commun des mortels, il est toujours possible de faire appel dans un premier temps au data scientist au sein même de l’entreprise. Cet expert peut effectivement bousculer la masse d’informations dans un bac à sable en la conciliant judicieusement avec diverses sources d’open data existantes. Et qui sait si ces différentes corrélations réalisées, caractéristiques d’un « datalab », ne vous permettront pas au passage d’élucider des problématiques de fraude ou de désabonnement, pour ne prendre que deux exemples concrets…

open data - Observatoire CONIX de la Donnée

Auteur : Elkhader FATNI. Illustration (mine d’or) par Gord McKenna, sous licence CC-BY-NC-ND