Avant l'apparition du web et des réseaux connectés, des données étaient déjà plus ou moins bien recueillies et restaient la plupart du temps dans des archives sous forme de gros pavés indigestes. Une mine d'or à l'abri de la poussière ! Aujourd'hui, l'interprétation de ces données constitue une information. Cette idée trouve ses fondements aux États-Unis à la fin des années 60 avec la loi sur le libre accès à l'information. C'est ainsi qu'est né l'Open Data.
Ce concept - d'aucuns préfèrent le terme de « mouvement » - consiste à mettre à la disposition des citoyens, des chercheurs, des associations et des entreprises des données numériques produites par les collectivités dans leur activité quotidienne : bases géographiques, statistiques, textes règlementaires, études, annuaires... de façon à ce que ceux-ci les exploitent pour créer de la valeur.
Il s'agit donc de faciliter l'accès aux masses de données numériques que les collectivités produisent dans leur activité quotidienne. Cette ouverture concerne en premier lieu les administrations publiques qui facilitent l'accès à leurs informations. Mais pour les entreprises privées, l'ouverture et le partage des informations représentent un moyen de se différencier, d'améliorer son offre de services et d'augmenter son potentiel de clients.
Selon la Commission européenne, cette ouverture doit tout particulièrement favoriser la création d'applications numériques, un marché évalué à environ 40 milliards d'euros par an en Europe. Aux États-Unis, le cabinet Gartner arrive aux mêmes conclusions dans son enquête.
L'ouverture des données consiste donc à supprimer les contraintes techniques, juridiques et financières qui entravent la libre diffusion et réutilisation des données. Trois obstacles se posent toutefois d'emblée.
Le premier est celui de la réglementation : il est indispensable de vérifier au préalable le cadre juridique dans lequel se place le propriétaire des données et quels sont les droits d'utilisation qu'il accorde à des tiers. À ce sujet, la révision d'une directive en décembre 2011 permettra une réutilisation de toutes les informations du secteur public accessibles, c'est-à-dire qui ne constituent pas des données à caractère personnel. Les développeurs, programmeurs, entreprises ou simples citoyens pourront obtenir et réutiliser ces données pour un coût très faible ou nul. Cette facilité est la concrétisation d'une proposition de la Commission demandant l'ouverture des données du secteur public dans toute l'UE. Une proposition acceptée par les États membres en avril dernier.
Le second, qui découle du premier, tient à l'enregistrement, la conservation et l'utilisation de données nominatives : celles-ci sont encadrées par la loi Informatique et Liberté (Loi n° 78-17 du 6 janvier 1978 relative à l'informatique, aux fichiers et aux libertés, modifiée en 2004), et ne peuvent de ce fait être intégrées à une démarche d'ouverture.
Le dernier tient à l'interprétation des données puis à leur exploitation : pour comprendre une série statistique ou établir une relation de cause à effet entre deux variables, il est nécessaire de disposer de logiciels de visualisation comme les tableurs, mais ce n'est bien souvent pas suffisant. Des sociétés, comme Mapize en France, proposent des outils d'infographie et de cartographie en ligne. Une solution efficace pour rendre « visuellement compréhensibles » des informations.
Des exceptions à cette ouverture
La finalité d'une action détermine le caractère public d'une information : les données produites par un opérateur privé dans le cadre d'une mission de service public, sont des données publiques. En revanche, les données qui participent à une mission de service public industriel et commercial ne sont pas a priori « publiques ».
En France, la loi considère la notion d'information publique, qui inclut les données, comme une information produite ou reçue « dans le cadre de leur mission de service public, par l'État, les collectivités territoriales ainsi que par les autres personnes de droit public ou les personnes de droit privé chargées d'une telle mission » . La loi française établit donc une obligation générale d'ouverture des données publiques, tout en prévoyant quelques exceptions :
- les données relevant de la vie privée,
- les données relevant de la sécurité nationale,
- les informations présentes dans des documents sur lesquels des tiers détiennent des droits de propriété intellectuelle.
La finalité d'une action détermine le caractère public d'une information : les données produites par un opérateur privé dans le cadre d'une mission de service public, sont des données publiques. En revanche, les données qui participent à une mission de service public industriel et commercial ne sont pas a priori « publiques ».
En France, la loi considère la notion d'information publique, qui inclut les données, comme une information produite ou reçue « dans le cadre de leur mission de service public, par l'État, les collectivités territoriales ainsi que par les autres personnes de droit public ou les personnes de droit privé chargées d'une telle mission » . La loi française établit donc une obligation générale d'ouverture des données publiques, tout en prévoyant quelques exceptions :
- les données relevant de la vie privée,
- les données relevant de la sécurité nationale,
- les informations présentes dans des documents sur lesquels des tiers détiennent des droits de propriété intellectuelle.
Open Data : pour faire quoi ?
« Il y a deux dimensions à l'Open Data : une dimension citoyenne/démocratique et une autre qui est économique. Pour les "politiques", l'Open Data c'est toujours de la communication est en général pris en charge par la direction de la communication (ce qui n'est pas une mauvaise idée). Les entreprises ne poursuivent pas le même objectif. Elles peuvent valoriser leurs données en les ouvrant pour créer un écosystème vertueux autour d'elle », indique François Bancilhon, p-dg de Data Publica.« C'est ce que fait par exemple Twitter. Autre objectif : montrer une certaine transparence ou mutualiser des données avec d'autres acteurs. Mais beaucoup de grands comptes font machine arrière après avoir montré de l'enthousiasme au début. Ils se heurtent à différents obstacles : risques menaces juridiques perçus, leur propre refus du changement... », poursuit-il. Pour les entreprises, les pistes sont donc multiples. D'où la nécessité de centrer sa réflexion en se posant les bonnes questions.
Quels sont les principaux bénéfices attendus ?
- Une meilleure image de marque : selon l'étude Bluenove - BVA « connaissance du concept d'Open Data » parue en septembre 2011, « 63 % des entreprises interrogées pensent pouvoir améliorer la satisfaction client grâce à l'ouverture des données ». Mais attention à ne pas dévoiler certains défauts ou imperfections.
- Un renforcement de sa capacité d'innovation : c'est un moyen de développer un écosystème autour de l'entreprise pour augmenter et accélérer sa faculté d'innovation en faisant appel à des tiers (développeurs, indépendants, start-up...) pour proposer de nouveaux produits et services.
- Une anticipation des usages sauvages : JC Decaux (pour son service de vélo en libre-service) ou la RATP par exemple ont été confrontés à des réutilisations non autorisées de leurs données. En les rendant publiques, elles ont mis fin à ces pratiques.
Quel est le modèle économique ?
- Les applications mobiles : elles représentent la face la plus visible de l'Open data. Cela s'explique premièrement par le fait que la majorité des premiers concours à idées avaient pour finalité le développement d'applications mobiles et, deuxièmement, par la forte demande des utilisateurs pour la mobilité (transports collectifs, vélo, parkings...).
Mais pour l'instant, la rentabilité directe de ces applications reste à démontrer. Cela peut cependant se révéler être un bon moyen de se faire connaitre comme a pu le constater NewLC. Avec Eo'City, un programme qui informe les Rennais des horaires de bus et de la disponibilité de places dans les parkings de la ville, NewLC n'a pas gagné d'argent. Elle a remporté un prix de 3 500 euros, mais le développement avait coûté environ 20 000 euros. « En revanche, nous nous sommes fait connaître. Nous avons même signé un contrat. On peut donc considérer que le retour sur investissement est là », résume Éric Bustarret, fondateur de NewLC qui emploie 8 personnes.
- Les revenus indirects engendrés par des API (interfaces de programmation) : à la différence de la vente d'applications mobiles, des solutions plus classiques sont plus rentables. Les poids lourds de l'internet l'ont bien compris. Le meilleur exemple est Amazon. Dès 2005, le site a ouvert ses bases de données de livres via une API. Des professionnels et des amateurs ont pu afficher sur leur site ou blog des informations sur les livres. Par ricochet, les internautes intéressés par un roman sont redirigés vers Amazon pour l'acheter. Le revenu est partagé entre le géant du e-commerce et le tiers.
- Des prestations sur mesure : comme dans l'Open Source, des entreprises s'appuient sur des offres de services pour augmenter leur revenu. C'est le cas entre autres de Data Publica. D'un « catalogue de données publiques » - s'appuyant notamment sur des « cartes augmentées » -, la société s'oriente depuis début 2013 vers les services et des produits sur le segment du B2B. Son modèle économique est bâti sur des prestations sur mesure, des offres allant de la découverte, à l'enrichissement et à la qualité des données, à la réalisation de jeux de données sur mesure ou sur étagères (jeux de données produits en partie à partir de données open data après traitement et enrichissement.
Les datavisualisations : l'info en images
Ce nouveau moyen de communication consiste à représenter des données de façon visuelle. Cela peut se concrétiser par des graphiques, des camemberts, des chronologies, des infographies.... L'une des références actuelles de la « dataviz » est sans doute le travail de David Mac Candless visible sur son blog, Information is beaufitul. Cet auteur-designer collabore notamment pour The Guardian et Wired.
Un autre bon exemple est le site Wheredoesmymoneygo. Développé par l'Open Knowledge Foundation, il traduit graphiquement l'usage qui est fait des impôts sur le revenu au Royaume-Uni. Certains sites ont réussi à mettre en place un business model. Pour 59 dollars par mois, chefs d'entreprises, directeurs marketing, journalistes et analystes peuvent consulter des données avec des graphiques interactifs sur DataMarket.
Pour réussir une dataviz, il convient de respecter trois règles de base :
- Un angle : comme en journalisme, il faut traiter le sujet sous un seul angle afin de renforcer l'impact de l'information. À vouloir être exhaustif, une suite de chiffres devient indigeste ;
- Des informations précises et vérifiées : c'est le B.A-BA du journalisme. Une belle présentation graphique ne doit pas masquer un contenu léger ou inexact ;
- Une présentation simplifiée pour aller à l'essentiel : l'information.
RATP : une ouverture sous la contrainte...
La Régie Autonome des Transports Parisiens a ouvert plusieurs données (positions géographiques des stations, qualité de l'air, liste des commerces de proximité...). Elle a également rendu publiques les informations liées aux flux des voyageurs transitant par ses stations. Celles-ci permettront de créer par exemple des applications mobiles utiles aux usagers des transports parisiens, ou encore servir de baromètre stratégique « aux commerçants pour installer une boutique ou un kiosque à journaux », a précisé Pierre Mongin, le P-DG de la RATP.
L'accès à ces données n'a pas été facile et a entrainé un conflit avec notamment Benjamin Suchar, de Checkmymetro. Son application pour mobile a profité de cette ouverture pour intégrer la carte officielle du métro parisien. « La RATP, c'est un bon exemple de ce qu'il ne fallaitut pas faire (ils sont en train de se rattraper, mais ils ont perdu du temps). La SNCF a été plus futée même si le résultat final n'est pas vraiment différent... La morale de l'histoire : il faut définir une stratégie intelligente et l'appliquer plutôt que d'attendre ou de faire sans réflexion de fond. Et si vous n'ouvrez pas vos données, il y a de fortes chances pour que quelqu'un veuille les ouvrir pour vous », constate François Bancilhon, de Data Publica.
Les principales initiatives publiques et privées
Apparu en premier aux États-Unis, l'Open Data a rapidement séduit des acteurs français de la sphère publique ou du secteur privé. Pour différents spécialistes, la situation française n'est pas ridicule par rapport à d'autres pays et notamment les États-Unis.Les initiatives publiques
En décembre 2011, le gouvernement français a lancé le site data.gouv.fr. Comme aux États-Unis ou en Angleterre, le projet a pour but de rendre accessibles quelques milliers de données publiques. « En accédant librement aux données publiques, les entrepreneurs pourront créer des services innovants. Ainsi lorsque la ville de Washington DC a lancé en 2008 son 1er concours d'open data, 47 applications furent développées en 30 jours pour environ 2.6 millions de dollars d'investissement », constatait à l'époque Séverin Naudet, alors directeur d'Etalab (remplacé par Henri Verdier depuis février 2013).
Fin 2012, le gouvernement a décidé de dissoudre Etalab dans la Direction interministérielle pour la modernisation de l'action publique, plus connue sous son ancien nom de Direction générale de la modernisation de l'État (DGME).
Cette décision ne signifie pas la fin du portail Data.gouv.fr. En avril dernier, Etalab a annoncé le lancement d'un programme de refonte du portail sur le mode collaboratif. L'institution entend ainsi impliquer la communauté du secteur et faire naitre un nouveau portail de la donnée publique répondant aux attentes des acteurs de l'Open Data en France. Des outils de visualisation des données, une meilleure indexation ainsi que des modules statistiques étaient les principales pistes évoquées.
Si l'État montre la voie, les collectivités territoriales n'ont pas attendu pour démarrer leurs propres initiatives. De nombreux sites consacrés à l'Open Data territorial sont ouverts. Ils permettent d'accéder à des données électorales, urbanistiques, sociales, sur le transport, etc.
En matière de transport, la SNCF a lancé un portail permettant à des développeurs externes de créer de nouvelles applications à partir de données rendues publiques. Un concours d'idées OpenApp a été organisé par SNCF Transilien. Environ 2 000 idées ont émergé parmi lesquelles une application conseillant le client pour optimiser son trajet en fonction de la charge et de l'encombrement du réseau. Suite à la catastrophe de Brétigny-sur-Orge, survenue en juillet dernier, une pétition qui demandait la libéralisation de l'ensemble des données détenues par la SNCF en matière de trafic et d'état du matériel et des équipements avait obtenu plus de 10 000 signatures.
L'Open Data ne se limite cependant pas aux données publiques. Un grand nombre de secteurs d'activité, ayant besoin de récolter et d'analyser des masses de données (la recherche, la statistique, le secteur de l'environnement, le journalisme, la culture, l'intelligence économique, la finance, l'urbanisme, la cartographie, pour ne citer qu'eux) ont développé depuis longtemps des pratiques de partage de données, selon des modalités propres.
Quelques initiatives privées
- Groupe Poult : en échangeant des données de marché avec d'autres producteurs de produits alimentaires, cette société, qui est le leader des biscuits à marque de distributeurs, a affiné sa connaissance du secteur alimentaire.
- Kéolis : pionnière en France de l'Open Data dès 2010, l'entreprise a lancé avec Rennes Métropole « L'entrepôt de données ». Ce site permet d'utiliser des données pour créer des applications. Exemple : ArceauVélo pour localiser sur une carte les emplacements de supports à vélo. Le portail regroupe plus de 140 jeux de données locales. Une dizaine d'applications disponibles sur l'AppStore proposent des services en lien avec les transports en commun.
- Nestoria : implantée dans 6 pays, dont la France, cette start-up anglaise récupère des données publiques sur les quartiers (services, transports, équipements scolaires...). Elle s'est associée avec des agences immobilières pour proposer un moteur de recherche pertinent. Le revenu généré par la consultation des annonces est partagé entre Nestoria et l'agence immobilière.
- Open Food Facts : considérée comme un « Wikipédia » pour les produits alimentaires, cette base de données recense toutes les informations que l'on peut trouver sur les étiquettes des produits : ingrédients, composition nutritionnelle, labels, etc. Ce site permet ainsi de découvrir de façon plus compréhensible le contenu d'un soda ou de connaître le lieu de fabrication d'une boite de haricots. Les données sont fournies par les particuliers, mais aussi par certains industriels. Aujourd'hui, 5700 produits sont référencés.
OpenStreetMap : le Wikipedia de la cartographie
Créé en 2004 par Steve Coast et des étudiants, OpenStreetMap ambitionne de créer une carte libre du monde. Mais à la différence de Google Maps, ce système informatique de cartographie peut être alimenté, modifié et copié par n'importe qui. OpenStreetMap profite actuellement des contributions apportées par 1 million de personnes dans le monde.
En France, différentes collectivités y participent. Pau est aujourd'hui l'une des deux villes de France, avec Lyon, à servir ainsi de relais à OpenStreetMap. Pistes cyclables, feux tricolores, sens de circulation... Diverses informations sont fournies par la Communauté d'agglomération. Il arrive même qu'OpenStreetMap soit plus à jour que les ténors du GPS ! Ainsi, le parcours de l'autoroute A65 y était disponible dès le jour de sa mise en service. Ce qui n'était pas le cas de la plupart des GPS utilisant des données cartographiques privées. À terme, ce projet pourrait devenir le pot commun de la cartographie.
Créé en 2004 par Steve Coast et des étudiants, OpenStreetMap ambitionne de créer une carte libre du monde. Mais à la différence de Google Maps, ce système informatique de cartographie peut être alimenté, modifié et copié par n'importe qui. OpenStreetMap profite actuellement des contributions apportées par 1 million de personnes dans le monde.
En France, différentes collectivités y participent. Pau est aujourd'hui l'une des deux villes de France, avec Lyon, à servir ainsi de relais à OpenStreetMap. Pistes cyclables, feux tricolores, sens de circulation... Diverses informations sont fournies par la Communauté d'agglomération. Il arrive même qu'OpenStreetMap soit plus à jour que les ténors du GPS ! Ainsi, le parcours de l'autoroute A65 y était disponible dès le jour de sa mise en service. Ce qui n'était pas le cas de la plupart des GPS utilisant des données cartographiques privées. À terme, ce projet pourrait devenir le pot commun de la cartographie.
Quelques portails dédiés à l'open data
- Data Publica : créée en juillet 2011, cette plate-forme privée est un des acteurs historiques de l'Open data. Elle fait un nouveau métier en France : développeur de jeux de données.
- Regards Citoyens : ce collectif a ouvert en novembre 2010 un portail de recensement des données publiques accessibles en France : nosdonnees.fr, qui précise quels sont les jeux couverts par une licence libre.
- Datalift 70 : projet expérimental financé par l'agence nationale de la recherche. Son but : développer une plate-forme pour publier et interconnecter des jeux de données sur le web sémantique.
- Data.gouv.fr : ouvert en décembre 2011, il permet d'accéder à des données (plus de 350 000 fichiers) rassemblées, créées ou conservées par les administrations et les services publics.
Devenir producteur d'informations : 3 questions-clés
Selon l'étude Bluenove-BVA, les grandes entreprises semblent convaincues de l'intérêt à ouvrir leurs données en particulier dans le domaine environnemental (40 %), technique (37 %), opérationnel (26 %) et marketing & communication (26 %). Mais avant de se lancer, il est indispensable de préparer le terrain en se posant différentes questions.
- Quel sera le mode d'accès aux données ? La majorité des ouvertures de données entraine la création d'une application mobile. Cette tendance devrait s'accentuer dans les prochaines années avec la montée en puissance des tablettes. Mais cela ne signifie pas pour autant qu'il faut abandonner l'idée de créer un portail internet destiné à une consultation depuis un PC de bureau. Son lancement peut être une source de trafic et donc de publicité. Encore faut-il que les données soient présentées de façon pratique, lisible et utile pour les visiteurs !
- Où seront hébergées les données ? À défaut de posséder un gros serveur et une équipe informatique capable d'en assurer la gestion, faites appel à un prestataire spécialisé. Il peut fournir un espace de stockage et un nom de domaine adapté à votre projet Open data. Pensez néanmoins à mettre en place une politique de sauvegarde des données afin de ne pas etre pénalisé par la défaillance passagère ou complète de l'hébergeur.
- Quel est le niveau de protection ? Qu'il s'agisse d'un prestataire ou de votre serveur, pensez à filtrer les accès et à identifier les personnes pouvant administrer ce projet. L'objectif est d'éviter une infiltration sur le réseau interne de l'entreprise. Il peut être judicieux de tester la vulnérabilité de votre service en utilisant un logiciel spécialisé dans la détection des failles de sécurité.« Peut mieux faire », tel pourrait être le commentaire (légèrement sévère) porté sur l'Open Data en France et à l'étranger. Concernant les acteurs publics, les principaux bénéfices sont indirects avec principalement des retombées médiatiques et le développement de services mobiles qu'ils ne peuvent ou ne souhaitent pas développer. Pour les réutilisateurs, la volonté de gagner de l'argent n'est pas encore une priorité. Selon une enquête réalisée par Socrata aux États-Unis (Open Government Data Benchmark Study 2011), un peu moins de 3 % des développeurs interrogés sont motivés par des profits. La majorité (plus de 40 %) veut rendre service aux utilisateurs de leur application. Quant aux utilisateurs, ils profitent de la diversité des services : consultation des données en ligne, visualisations, applications mobiles.
« Beaucoup de choses ont été faites. Au niveau national, il y a eu une prise de conscience importante des opportunités qu'offre l'Open Data . Mais les utilisateurs ont un peu assimilé ce concept avec une application gratuite pour smartphone. Le ludique, pourquoi pas. Mais l'Open Data doit servir à progresser et à trouver des solutions concernant des sujets majeurs comme le chômage, l'éducation, la culture... Il s'agit de répondre à des systèmes complexes. Si l'on prend l'exemple de la canicule de 2003, le ministre de la Santé, qui était sur la Cote d'Azur à ce moment-à affirmait qu'il n'y avait pas de soucis. Il n'avait pas tort, car les chiffres qu'on lui fournissait indiquaient en effet qu'il n'y avait pas d'urgence. Mais ces données provenaient des pompes funèbres et non pas des hôpitaux, d'où un décalage de 3 ou 4 semaines avec la réalité de la situation ! Cet exemple est un vrai problème Open data car les statistiques sur la mortalité doivent être à la disposition des citoyens, mais surtout des personnes qui gèrent le pays », précise François Bancilhon.
L'Open Data est donc entré dans les mœurs, mais son business model reste encore à confirmer. Du côté des pouvoirs publics, un rapport remis début novembre au Premier ministre indique que la réutilisation des données « libérées » a permis de générer quelque 35 millions d'euros en 2012. L'auteur souligne toutefois que ces recettes sont concentrées « sur un nombre très restreint d'opérateurs et de ministères : l'INSEE et l'IGN perçoivent chacun près de 10 millions d'euros et le ministère de l'intérieur près de 4 millions d'euros. Sur 27 redevances au total, les 14 plus petites rapportent, ensemble, moins de 5% du total, soit moins de 1,75 million d'euros ».
Parmi les 36 entreprises sondées par le groupe Serda-Archimag (une société spécialisée depuis 26 ans dans les domaines de l'organisation de la mémoire et du savoir), seul un tiers transforme la « data » en source de revenus. 97 % du chiffre d'affaires généré sur ce marché en 2011 l'était par des éditeurs de contenus payants s'adressant aux professionnels. Selon cette étude Open Data en France : acteurs, projets et tendances, parue en décembre 2012, le « marché de l'ouverture et de la réutilisation des données publiques est estimé à 827 millions d'euros en 2011 ».
Selon cette étude, les freins au décollage du marché de l'Open Data sont les suivants :
- Un décalage entre l'offre de données et la demande : les données reconnues comme ayant le plus de potentiel en termes de création de valeur ne sont pas encore libérées. Beaucoup de données, notamment détenues par les Epic (Établissement public à caractère industriel et commercial) - comme la SNCF - ou des associations d'utilité publique sont encore « verrouillées » ou mises à disposition dans des formats non exploitables.
- Trop peu d'APIs créées afin de permettre des mises à jour automatiques des données. Selon l'enquête serdaLAB, près d'un tiers des réutilisateurs sont mécontents de la mise à jour non régulière des données.
- Les données locales publiées par la vingtaine de collectivités pionnières ne permettent pas aux développeurs de créer des applications d'envergure nationale, ce qui leur permettrait de générer un ROI.
Pour la FING (Fondation Internet Nouvelle Génération), l'usage des données libérées n'en est qu'à sa genèse : « l'enjeu est de sortir l'Open Data des spécialistes de l'informatique. Il s'agit de pérenniser, généraliser et banaliser l'Open Data comme levier de développement des territoires, l'intégrer dans les grands projets urbains ».
Sur le sujet, voir aussi :