En gros, les services du premier ministre (lire ‘Etalab’) reprennent en main les conditions de diffusion des informations publiques. Si une administration veut faire payer la réutilisation d’une série de données, elle devra d’abord la faire inscrire à un décret fixant la liste des données payantes, qui sera publiée dans les semaines qui viennent.
C’est une bonne chose. Aujourd’hui, les ministères fixent les tarifs au petit bonheur. Au ministère de l’écologie, l’instruction d’une demande coûte 145€, comme vous pouvez le voir sur le devis ci-dessous.
Comme le contrat ne prévoit pas de limite dans la réutilisation, j’ai évidemment mis en ligne les fichiers Excel sur NosDonnées.fr. Le but du décret est de mettre un terme à de telles pratiques et de favoriser la gratuité.
Pour en savoir plus sur cette mesure, Numérama a fait un bon tour d’horizon, tout comme Regards Citoyens.
Fillon est plus prolixe dans sa circulaire, où il dévoile plus ses intentions.
- L’opendata, c’est Etalab.
L’ouverture des données publiques a commencé en 1978 avec la création de la Commission d’Accès aux Documents Administratifs (CADA), chargée de rendre des avis lorsque les citoyens demandent des informations à l’administration.
Depuis la refonte de la loi CADA, en 2005, à la suite de la directive européenne PSI, des correspondants locaux ont été nommés dans chaque administration. Leur rôle est de faire le lien entre les citoyens demandeurs d’information et la CADA.
Or, la circulaire demande à chaque administration de nommer un interlocuteur unique Etalab. On rajoute donc un deuxième système à celui de la CADA. Tant pis pour la simplification de l’administration.
Pour Etalab, les deux rôles n’ont rien à voir. Les représentants CADA ne sont là que pour régler les problèmes. Les interlocuteurs Etalab, en revanche, auront un rôle actif et prendront des initiatives pour mettre en ligne les données et aucune synergie ne peut être développée entre représentants CADA et Etalab.
- L’approche top-down triomphe.
La loi CADA prévoyait que les citoyens puissent demander les informations recherchées à l’administration. Prenant le contrepied de cette approche bottom-up, Etalab consacre une approche top-down où les administrations décident de ce qu’elles diffusent – et de ce qu’elles gardent.
La CADA n’est mentionnée qu’une fois dans la circulaire, son rôle se bornant à « veiller au respect des dispositions légales relatives à la réutilisation des informations publiques. » Ce que prévoit de toute façon la loi de 1978.
Comme je l’expliquais en février dernier, l’approche top-down n’a aucun sens quand on parle de données publiques, dans la mesure où l’exhaustivité ne sera jamais atteinte (opendata.paris.fr ne propose encore que 36 jeux de données, par exemple, et data.gov.uk à peine 7000) et où les contribuables n’ont pas à payer pour la mise en ligne de données qui seront exploitées par des entreprises privées.
L’espoir d’Etalab est d’arriver à lister l’intégralité des données publiques, rendant la CADA inutile.
- Les « circonstances particulières » du payant.
Les données ne pourront être payantes que lorsque des circonstances particulières sont réunies. A en croire les propos tenus par Séverin Naudet aux Echos, les “grands équilibres” de certaines administrations dépendant de la vente d’information doivent être préservés de la sorte. Pourtant, pas question de se lier les mains avec une définition trop précise de ce qui restera ou deviendra payant. Même si le premier ministre (lire: Etalab) restera seul décideur, le Conseil d’orientation de l’édition publique et de l’information administrative, un groupement d’acteurs publics et privés, devra rendre un avis avant toute décision. Si les circonstances particulières restent floues, le parcours d’obstacle avant de pouvoir inscrire un jeu de données sur la liste payante sera long.
Heureusement, les circulaires, mêmes signées par le premier ministre, n’ont pas plus de valeur qu’une note de service et ne sauraient faire force de loi. Mais les décisions de Matignon montrent que le chemin à parcourir pour ouvrir les données publiques reste long.
Photo par RSLN
]]>Cette dépêche semble familière. Mieux, elle marche dans toutes les situations. Essayez vous-mêmes et relisez-la avec , , ou .
Alors que l’on tend à juger les conflits au nombre de leurs victimes, le cérémonial dépassionné qui entoure leur comptage rend caduque tout sens des proportions. Pour redonner du sens à ces chiffres, le projet 100 Years of World Cuisine, dont je fais parti, a voulu les recontextualiser en offrant une échelle. Comme nous l’indiquons sur la page de présentation, « ce projet ne cherche pas à remplacer une démarche scientifique, mais à apporter un autre regard, porteur de sens ».
La cuisine reste reste l’endroit où l’on s’attend le moins à voir la violence émerger, au cœur de nos foyers. En plaçant la scène dans cette pièce, la photo renforce l’absurdité de la guerre.
Cette démarche rejoint la visualisation des morts de la guerre en Irak proposée la semaine dernière sur OWNI.
Tout au long du projet, la question de la justification des conflits choisis nous a été posée. Pourquoi telle guerre et pas telle autre ?
Loin d’offrir des réponses, le projet vise seulement à s’interroger sur l’importance relative accordée aux différents conflits. La comparaison entre le conflit israélo-palestinien et les guerres du Congo est particulièrement frappante. Le premier a fait un peu plus de 50.000 morts et régulièrement la « une » des journaux. Le second a fait plus de 3 millions de victimes entre la fin des années 1990 et le début des années 2000, mais reste peu couvert.
Un journaliste affirme dans le documentaire Décryptage qu’il y a autant de journalistes à Jérusalem que dans tout le continent africain. Sans être forcément vraie, cette comparaison montre que personne ne hiérarchise les conflits selon le nombre de morts, ou même selon le nombre de morts-kilomètre (une théorie qui affirme que les médias couvrent plus les évènements proches de leur lectorat).
Le traitement des conflits semble être fait de manière arbitraire, laissant toute latitude aux éditeurs et aux utilisateurs pour décider de l’importance à accorder à chaque évènement.
Les choix réalisés pour la photo mettent également en évidence la difficulté de compter les victimes et de définir les contours d’un conflit. La guerre du Vietnam a-t-elle durée de 1965 à 1975, comme le considère les Américains, ou de 1946 à 1975, comme le considèrent peut-être certains Vietnamiens ayant subi la guerre avec les Français avant celle des Américains ? Ou bien a-t-elle commencée avec l’occupation japonaise en 1940 ?
Impossible de dater objectivement le début et la fin d’une guerre. L’armistice laisse souvent la place aux pillages et aux échanges de population, comme le montre le très meurtrier exode des populations germanophones installées à l’est de l’Oder. Entre 1944 et 1946, plus de 500 000 Allemands sont morts en fuyant vers l’Ouest, alors que la paix était revenue.
Compter les victimes est également impossible. La guerre empêche souvent d’établir des certificats de décès et les disparus peuvent également avoir fui sans laisser de trace. Les historiens sont obligés de recourir à des estimations plus ou moins précises pour établir un nombre de morts.
Bruce Sharp explique par exemple dans un article comment ont été comptées les victimes du génocide Khmer. Les premiers résultats, menés par le gouvernement suivant le régime de Pol Pot, a interrogé tous les foyers cambodgiens pour arriver à un total de 3 314 768 victimes. Certains historiens ont comparé les recensements pré-génocide avec ceux post-génocide et, compte-tenu de l’accroissement naturel au début de la période, sont capable d’estimer le nombre de personnes ‘manquantes’ en fin de période à 1,7 million. D’autres ont interviewé des survivants, demandant à chaque fois combien de personnes de leur entourage avaient disparu. En faisant la moyenne et en extrapolant à l’échelle du pays, ils arrivent à un total de 1,5 million. Les estimations actuelles tournent, elles, aux alentours de 2 millions de morts. La précision du premier semble totalement fantaisiste au regard des estimations des historiens, qui, n’arrivent pas eux-mêmes à réduire leurs marges d’erreur en deçà de 200 000 victimes.
Cet exemple souligne la nécessité de porter un regard critique envers les chiffres diffusés lors de catastrophes majeures. La rapidité avec laquelle sont relayées les dépêches chiffrées, sans analyse minutieuse de l’origine des calculs avancés, ne font que renforcer l’absurdité des communiqués laconiques lors desquels le présentateur nous annonce le nombre de victimes.
100 Years of World Cuisine est un projet de Clara Kayser-Bril, Nicolas Kayser-Bril et Marion Kotlarski.
]]>Chaque jour, nous produisons deux ou trois exaoctets [en] de données, soit 1 million de téraoctets. Dans le même temps, Facebook et ses 600 millions d’utilisateurs produisent à eux seuls 70 téraoctets, soit à peine 0.007% du total. Pour comparer, un journal papier traditionnel pèse entre 1 et 50 mégaoctets.
Si l’on veut synthétiser toute l’information produite en quelque chose de digeste pour l’utilisateur final, il faut résumer par un facteur de 100 milliards. Pas facile pour un journaliste.
Pour faire sens de cette hyper-abondance de contenus, les professionnels de l’information doivent adopter de nouvelles techniques. Dans un monde analogique, l’enregistrement et la restitution permettent de rendre compte de manière optimale de la réalité. Dans un monde numérique et connecté, la difficulté ne vient plus de l’enregistrement mais de l’extraction de données pertinentes. Pour les exploiter, il devient indispensable de s’approprier des connaissances en analyse de données et en statistiques.
Une fois équipé des bons outils, faire parler des masses de données devient possible. La plupart des opérateurs téléphoniques, tels Vodafone [pdf/en], China Mobile [en] ou Verizon [en], utilisent les données produites par leurs utilisateurs pour prédire les embouteillages, par exemple. De telles techniques pourraient également être utilisées par les journalistes pour prévoir les manifestations.
L’aboutissement du datajournalisme reste de penser tout type d’information comme une donnée à mettre en lien et en contexte pour lui donner du sens. Si Vodafone est capable de transformer les informations de communication d’un simple GSM en service de prédiction des bouchons, les professionnels de l’information doivent être capables de réassembler et de manipuler les éléments pris dans l’actualité pour en extraire des tendances et du sens pour le citoyen.
L’information telle qu’on la consomme habituellement, sous forme de textes ou d’images, n’est que très partiellement compréhensible par l’ordinateur. Les masses d’information accumulées par les journalistes restent amorphes une fois publiées, alors qu’elles pourraient être valorisées en fournissant le contexte nécessaire à la compréhension des articles du jour.
Certaines initiatives vont dans ce sens. L’International Press Telecommunications Council (IPTC) vient de publier un format de description des données permettant d’identifier clairement les personnes, les lieux et les organisations impliquées dans un article. Ce standard, rNews, a été dévoilé le 5 avril. L’IPTC compte parmi ses membres l’AFP, la BBC et 27 autres acteurs majeurs des médias. Son pas en avant va peut-être accélérer le passage des médias au web sémantique et aux données liées.
Pour diffuser sur l’ensemble des plateformes et des écrans, les contenus doivent être capables de prendre différentes formes. Du SMS à l’infographie dynamique, l’information doit pouvoir être consommée dans n’importe quelle situation, y compris celles que nous n’imaginons pas encore.
La plupart des rédactions peuvent certainement prendre à leur charge la distribution de leurs contenus sur le web, via leur site. Une petite partie d’entre elles est capable de faire de même sur l’iPhone, sur Android et sur l’iPad. Et malgré ça, aucun média français (à part 10 minutes à perdre) n’est capable de se positionner parmi les 100 app les plus vendues sur iTunes.
En donnant la possibilité à tout développeur d’accéder à leurs informations, les médias peuvent diffuser beaucoup plus largement leurs contenus, sans se poser la question du support. Tout comme la plupart des titres papier externalisent l’impression et la distribution, les sites web peuvent se débarrasser de la diffusion et laisser les spécialistes – les développeurs – s’en charger.
Les API (interfaces permettant aux ordinateurs d’accéder directement à l’information) du Guardian (Open Platform) et du New-York Times (Developer Network) donnent une idée de ce à quoi pourrait ressembler un média réellement liquide. C’est ainsi que les médias pourront cesser de devenir des répertoires de données pour devenir des points d’échange obligés dans le parcours de l’information.
L’actif des médias, en plus de leur marque, reste leur audience. Sa valeur ne provient plus de sa capacité à être vendue aux annonceurs, mais des possibilités de l’intégrer au processus de création de l’information. Le crowdsourcing permet d’augmenter, d’après l’expression d’Eric Scherer, l’information préexistante. Que ce soit pour compléter une base de données (comme nous le faisons avec prixdeleau.fr) ou pour valider des informations (comme sur InfluenceNetworks), l’apport de l’audience différencie profondément un média, enrichisseur de données, d’une base de données « froide ».
Les médias ont, jusqu’à présent, évolué sur un marché où ils offraient une information à leurs lecteurs ou spectateurs et une audience à leurs annonceurs. A une époque où l’information était une ressource rare et où les annonceurs ne pouvaient pas toucher directement leur public, les médias créaient de la valeur aux deux bouts de la chaîne.
Aujourd’hui, cette position n’est plus tenable. Les lecteurs peuvent contourner les médias et s’informer via de nouveaux canaux (Wikipédia, Facebook, les sites d’institutions ou d’ONG) et les annonceurs peuvent toucher leur audience sans passer par les médias.
Cette dynamique redessine complètement le marché des médias et de l’information. Pour obtenir l’attention de leurs prospects sur un marché hyper-compétitif, les annonceurs ont intérêt à investir massivement dans la qualité du contenu. Unilever, l’un des plus gros annonceurs traditionnels, pénètre ainsi le marché du divertissement en produisant un jeu vidéo en ligne pour ses glaces Magnum (Pleasure Hunt).
Des ONG, qui se seraient auparavant contenté d’envoyer des communiqués de presse aux médias de masse, publient directement les résultats de leurs études et de leurs actions sur leurs sites. Les ONG sont devenues des médias comme les autres [en]. De nouveaux acteurs de l’info, comme Wikileaks et OpenLeaks, l’ont d’ailleurs reconnu clairement. Le premier en offrant les télégrammes diplomatiques évoquant le traité ACTA à la Quadrature du Net [en], une association militant pour les libertés numériques, le second en faisant en sorte d’accueillir en son sein autant d’ONG que de médias.
Les institutions ne sont pas en reste, même en France. Le Quai d’Orsay prend particulièrement au sérieux son nouveau rôle de média. Sur Twitter, @francediplo compte sept fois plus de followers que @France_Info_Com, par exemple. Le ministère des affaires étrangères publie également sa propre série de web-documentaires, Destinations.
La rareté, aujourd’hui, ne réside plus dans l’accès à l’audience (ce pourquoi les annonceurs allaient vers les médias) ni dans l’accès à l’information (ce pourquoi les consommateurs se tournaient vers les médias). La rareté, aujourd’hui, réside dans la confiance à accorder à une information.
Dans un univers de contenus surabondants, produits par tous, la valeur vient de la relation de confiance que l’on arrive à tisser avec son audience. Un tel changement de paradigme met sur un pied d’égalité tous les producteurs de contenus, média y compris.
]]>Questa applicazione tratta di alcuni semplici aspetti della crisi creditizia greca e delle ragioni per cui le agenzie di notazione hanno proceduto ad un declassamento del debito greco, e questo malgrado il fatto che l’introduzione dell’euro avesse permesso una riduzione massiccia del costo del debito stesso. Questa presentazione risale all’anno passato allorché l’opinione pubblica francese riteneva che fosse in atto una cospirazione ai danni dei paesi del Sud Europa rispetto ad esempio l’Irlanda che registrava livelli di deficit preoccupanti. Purtroppo quello che è successo subito dopo ha dato torto a questa interpretazione dei fatti!
Al fine di meglio capire la crisi greca, abbiamo raccolto alcuni dati macroeconomici da Eurostat sui paesi europei dal 1995 al 2010 (dato non ancora disponibile a quel tempo)
Sull’asse dele ordinate è rappresentato l’eurbor 3M che rappresenta il tasso a cui le banche prestano l’un l’altra. Questo tasso rappresenta la base di calcolo del costo del debito che corrisponde all’euribor aumentato dallo Spread di Credito che una qualunque controparte creditizia (Stati compresi) devono pagare.
L’asse delle ascisse mostra il deficit pubblico.
Possiamo notare come nel ‘95 la Grecia soffriva già di un deficit al 10% mentre il tasso interbancario era al 16%.
Durante gli anni ‘90 la Grecia ha ridotto parzialmente il debito ma registra la peggior performance della zona Euro; questo malgrado il fatto che i tassi si fossero drammaticamente ridotti portando una componente importante del costo del debito a livelli bassissimi storicamente (il costo del debito non è descritto nel grafico). Si nota nel grafico la convergenza dei tassi euribor.
Fino a che l’Irlanda ha superato la Grecia.
La situazione greca risulta ancora più chiara allorché si seleziona sull’asse delle ordinate il debito pubblico. Nel 1995, esso si attestava già al 97% del PIL.
La Grecia è riuscita a ridurre il peso del debito ma rimane inesorabilmente nell’angolo in alto a sinistra del grafico, questo vuol dire che essa cumula il debito ed il deficit più alti dell’area Euro; inoltre non sono visibili rimborsi consistenti del debito in anni di surplus.
Questo aproccio storico ci permette di meglio comprendere il rating della grecia da parte delle Agenzie di Rating. Prendiamo per esempio Standard & Poor’s e si comparino Grecia ed Irlanda. (Si noti che nel grafico, più in alto si trova il paese, più alto è il rating; inoltre più basso è il rating, più alto lo spread di credito)
Entrambi i paesi hanno traiettorie simili tranne che, per ciò che riguarda l’Irlanda, questa negli anni ‘90 e 2000 ha avuto un minor deficit e quindi un rating migliore, perché un debito più contenuto. Questo spiega come, anche se il deficit irlandese ha superato quello greco nel 2009, l’Irlanda abbia avuto un rating migliore legato al fatto che storicamente la sua posizione creditizia sia stata di gran lunga migliore di quella greca.
—-
Crediti fotografici: CC Flickr: “Credit Crunch” par bitzcelt
]]>Le schéma pourrait gagner en lisibilité. Par ailleurs, les relations exposées par cette enquête peuvent être utiles à d’autres journalistes travaillant sur des thèmes connexes. En l’état, difficile de réutiliser le travail de Milovac.
L’analyse de réseaux est un thème en vogue chez les médias et les ONG. Channel 4 entretien Who Knows Who, une base de relations entre personnalités britanniques. A Hong Kong, le South China Morning Post a lancé Who Runs HK ?, qui fonctionne de la même manière. Ces interfaces, bien que gérées par des journalistes, restent fermées et incompatibles avec les standards ouverts.
Du côté des geeks, le projet Little Sis est, lui, collaboratif et ouvert, avec son API. Il recense 57 000 personnes et près de 300 000 connexions. Seul problème : l’information présentée n’est pas validée et seul un système d’alerte (flag) permet de lutter contre la désinformation. Compte-tenu de la sensibilité d’un tel projet, les lobbys de tous poils auront tôt fait de manipuler le système.
Il manquait donc un outil d’analyse de réseaux d’influence à l’usage des journalistes qui soit à la fois ouvert et fiable. Influence Networks cherche à répondre à ce problème. La plateforme permet à quiconque d’insérer une relation dans la base de données (onglet add a relation). L’information insérée reçoit le statut de “rumeur” tant que personne n’a vérifié sa fiabilité.
L’onglet review a relation permet de vérifier la crédibilité des relations ajoutées par les autres utilisateurs. La relation est alors notée sur une échelle allant de rumeur à fait établi. La note reçue par la relation dépend également de l’indice de confiance (trust level) de l’utilisateur qui la vérifie.
Prenons un exemple. Mathias s’inscrit sur la plateforme. Il commence avec un trust level de 1 sur une échelle de 5. Il insère une relation sourcée, qui est ensuite validée comme un fait établi par un utilisateur possédant un trust level de 5. La relation obtient alors le statut de fait établi et le trust level de Mathias augmente de 0.5.
Mathias ajoute ensuite une autre relation sourcée, validée cette fois en tant que “fait établi” ci par Georges, qui a, lui, un trust level de 1. Cette fois-ci, puisque l’on ne sait pas quelle confiance accorder à Georges, la relation obtient un statut légèrement supérieur à celui de rumeur.
Aujourd’hui, alors que le projet vient d’être lancé, la base ne compte encore que peu de relations. Nous ajouterons dans les mois qui viennent une fonctionnalité d’ajout de relations en masse (une feuille de présence à un meeting, par exemple). Par ailleurs, les entités (personnes et organisations) que l’on peut mettre en relation sont celles offertes par freebase, une sorte de Wikipédia structuré dans un format compréhensible par l’ordinateur. Dès lors, si l’entité recherchée n’est pas disponible, il faut aller l’ajouter manuellement dans freebase [inscription nécessaire]. Là encore, nous allons ajouter une fonctionnalité permettant d’effectuer cette tâche au sein d’Influence Networks.
L’objectif d’Influence Networks est, à terme, qu’un journaliste ou un groupe de citoyens engagés puissent définir un sujet d’enquête (les liens entre l’actionnaire majoritaire d’un groupe de cosmétiques et le gouvernement, par exemple) et collecter des informations de manière collaborative, sans passer un temps considérable à valider et vérifier les éléments reçus.
Les éléments collectés étant recueillis dans un format compréhensible par l’ordinateur et structuré de manière sémantique, les données peuvent être croisées et parler d’elles-mêmes. Une recherche entre les entités L’Oréal et gouvernement français, par exemple, aurait pu montrer directement les possibles conflits d’intérêts d’Eric Woerth en montrant qu’il était lié à la multinationale via sa femme.
L’outil n’est, bien sûr, pas adapté à de l’investigation réalisée à partir de documents confidentiels, mais il permet de structurer et de réorganiser l’information déjà publique. Et l’analyse d’origine source ouverte (OSINT) reste l’un des domaines les plus dynamiques du renseignement – et, partant, du journalisme d’investigation.
Influence Networks est le fruit d’une collaboration entre OWNI, Transparency International, Zeit Online et l’Obsweb de l’université de Metz. Ce groupe a porté le projet et l’a présenté à deux concours de journalisme innovant. Nous n’avons pas été sélectionnés en finale du Knight News Challenge, mais sommes arrivés parmi les 75 premiers (sur plus de 1 500 candidats).
Nous faisons en revanche partie des 10 finalistes de l’Uutisraivaaja Challenge, concours similaire organisé par les finlandais de la Sanomat Foundation. La dotation de 10 000€ reçue nous permettra de rajouter plusieurs fonctionnalités et de continuer à rechercher des moyens de développer le projet.
Par ailleurs, le code de l’application est ouvert avec la licence MIT. N’hésitez pas à aller le décortiquer chez GitHub et à contribuer au développement de nouvelles fonctionnalités !
]]>L’été dernier, des Français ont montré que l’on pouvait s’organiser sans organisation, en utilisant uniquement des réseaux sociaux. Le résultat, les apéros Facebook, ont permis aux jeunes Français de s’affirmer dans l’espace social, avant que le ministre de l’Intérieur ne vienne siffler la fin de la récré.
L’hiver suivant, les Tunisiens ont fait pareil. Ils se sont organisés via le web, sans structure préexistante. Là où nous avons fait des apéros, ils ont renversé un tyran.
J’ai discuté avec des Tunisiens enthousiastes à l’idée de déconstruire le système de censure, sans doute mis en place par une société européenne. Des Tunisiens qui cherchaient un moyen de recycler la compétence des cyber-censeurs, célèbres pour avoir réussi un formidable hack de Facebook pendant la révolution, pour faire avancer la démocratie naissante.
Pendant ce temps-là, en notre nom et avec nos impôts, le gouvernement français s’apprête à publier les décrets d’application de la loi LOPPSI 2 et de son système de censure du net.
Les Français viennent de voter massivement pour le Front National. Les Tunisiens que j’ai rencontré se demandaient comment garantir au mieux le respect des minorités dans la nouvelle constitution.
La liste pourrait continuer. Elle montrerait que l’ensemble des valeurs que l’on croyait spécifiquement européennes, françaises, voire chrétiennes, existent bien de l’autre côté de la Méditerranée. Alors qu’elles sont méprisées chez nous, sûrs que nous sommes de leur pérennité, elles fleurissent en Tunisie.
Des crétins, que l’on ose encore appeler intellectuels, se posaient encore la question de savoir si l’islam était compatible avec la démocratie. Aujourd’hui, la démocratie est mieux comprise par les Tunisiens de tous âges avec lesquels j’ai parlé que par la plupart des Français que je connais.
Eux se posent la question de la représentativité quand la France refuse depuis 20 ans à 15% des votants d’être représentés au Parlement. Eux se posent la question de la confiance à accorder aux partis islamiques quand nos partis refusent de s’allier contre les mouvements anti-démocratiques. Eux se posent la question de l’utilisation des wikis dans le processus législatif ou de la propriété des données personnelles. Riches de l’expérience qu’ils ont vécue ces dernières années, le niveau des conversations que j’ai eu à Tunis dépassait, de loin, celles que j’ai pu avoir à Paris avec des personnes aux responsabilités équivalentes.
Aboubakr Jamai expliquait, durant son talk, que les jeunes avaient besoin de « folie » pour avoir le courage de faire changer les choses, compte-tenu des risques. Cette folie, les Tunisiens l’ont retrouvé, et elle leur a permis ce bond extraordinaire à un coût minime. On m’a beaucoup répété que le nombre de morts avait été très faible. Entre 300 et 500. Beaucoup trop, mais encore moins que 6 mois d’accidents de la route en France chez les 18-24 ans. Si nous sommes capables de prendre le risque de conduire bourrés, pourquoi ne sommes-nous pas capable de défier un gouvernement qui dépasse les bornes ?
Pourtant, la folie ne suffit pas forcément. Pendant la conférence, un Burkinabé me dit
Chez moi, je peux faire ce que je veux, je peux insulter le président devant lui si je veux. Mais je n’ai pas ça. Je n’ai pas de salles de conférence, pas de voitures.
La liberté n’a d’intérêt que si les besoins fondamentaux sont satisfaits. Il est probable que, comme en Géorgie après 2003, en Ukraine après 2004 ou au Liban après 2005, les besoins matériels entament la ferveur réformatrice et que la révolution ne mène pas directement à une démocratie. Peut-être trop sûrs de leurs spécificités, les Tunisiens que j’ai rencontré n’ont pas contacté les acteurs des autres révolutions colorées. L’échange pourrait permettre de partager les retours d’expérience et augmenter les chances que la révolution réussisse.
Mais, quel que soit l’état du pays demain, les Tunisiens sont en train de montrer que le refus de la résignation paye, que la mobilisation n’est pas vaine, que l’on peut s’organiser pour atteindre un but sans s’adosser à un parti ou une institution. Ces leçons ont été comprises en Egypte, à Bahreïn, au Yémen et dans d’autres dictatures. Il serait grand temps que nos démocraties “vieillissantes et complaisantes” (selon les mots de François Pelligrini) les comprennent, elles aussi. Les Tunisiens ont beaucoup à nous apprendre.
En attendant les vidéo officielles, retrouvez le TEDxCarthage grâce aux vidéos filmées sur place ou grâce aux enregistrements du livestream, et ma présentation sur l’infobésité et le journalisme.
Mise à jour 23/03/2011 16:51. Suite à cet article et à l’écho que vous lui avez donné, la vidéo liée illustrant certains ‘crétins’ français (un débat filmé chez RTL où l’on apprenait que l’islam n’était pas compatible avec la démocratie) a été retirée. Voilà un crétin suisse pour le remplacer. Et la vidéo originale, retrouvée ailleurs.
Mise à jour 24/03/2011 09:29. Attribution de la formulation “démocraties vieillissantes et complaisantes” à François Pelligrini.
—
Crédit Photo FlickR CC : plagal / TEDxCarthage
]]>En effet, le coût de l’eau explose depuis les années 1970. Rien que depuis 1990, il a quasiment été multiplié par trois, quand l’inflation n’a atteint que 50%.
Par ailleurs, l’information concernant les coûts est morcelée. L’acheminement de l’eau est un service géré par les communes, si bien qu’aucune structure centralisée et publique ne recense les informations. Impossible alors de savoir si l’eau est plus chère dans ma commune que chez le voisin. Pas facile, dans ces conditions, d’évaluer correctement les compétences de la régie responsable du service public de l’eau.
Déjà en 2001, un rapport parlementaire arrivait à la conclusion que « la jungle des prix [était] inacceptable ». Depuis, un Observatoire National de l’Eau a été lancé. Son rôle, définit par le gouvernement en 2009, est de créer une fiche d’identité des services de l’eau pour chaque territoire. Volume des fuites, prix des services, qualité de l’assainissement… L’observatoire est chargé de collecter 40 points de données par commune, en les demandant aux maires.
Pourtant, deux ans après sa création, seules 3% des communes – représentant 30% de la population – ont joué le jeu. Les contre-incitations sont en effet nombreuses pour les maires. Les informations sont parfois entre les mains des délégataires du service public de l’eau (Suez, Veolia etc.), qui refusent de les transmettre. Certains maires agriculteurs peuvent aussi refuser de communiquer les données sur la qualité d’une eau qu’ils savent polluée.
Pour contourner ces obstacles, la Fondation France Libertés et 60 Millions de Consommateurs, en partenariat avec OWNI, lancent l’Opération Transparence. Ce crowdsourcing vise à collecter, via les utilisateurs directement, les données manquantes.
L’interface permet d’envoyer sa facture d’eau et de saisir les informations qu’elle contient. Cela permettra de collecter des informations auprès, potentiellement, des 36 millions de Français en maison individuelle. Les autres peuvent demander la facture à leur syndic ou directement à leur mairie les informations qu’elle détient.
La validité des contributions est garantie par un système de vérification collaborative. Chaque contribution doit être validée par un membre dont la contribution a déjà été validée pour être acceptée dans la base de données. Sans modération centralisée, le système est ainsi capable de monter rapidement en puissance.
La principale innovation de ce crowdsourcing citoyen tient à la possibilité pour les internautes de demander directement un avis à la Commission d’accès aux documents administratifs (CADA) en cas de non-réponse des mairies. En effet, en cas de refus d’une administration de fournir des informations publiques, tout citoyen peut saisir cette commission, qui rend alors un avis donnant raison au demandeur ou à l’administration.
L’Opération Transparence sera le premier essai d’une saisie à grande échelle de la CADA autour d’un problème précis. Cette initiative contribuera à une plus grande connaissance de cette administration inconnue du grand public (5 fois moins connue que la CNIL, par exemple) et délaissée par les pouvoirs publics. Son budget d’un seul million d’euros par an place la France à la dernière place européenne en termes de ressources par habitants dévolues à l’ouverture des données publiques.
Les données collectées seront présentées au Forum mondial de l’eau de Marseille le 22 mars 2012.
Rendez-vous sur prixdeleau.fr pour contribuer à cet effort qui améliorera l’information sur le marché de l’eau, poussant le rapport qualité/prix vers le haut, et qui ouvrira les données publiques à une échelle encore jamais réalisée en France.
—
Crédits Photo via Flickr: [cc-by-nd] mitwa17
Image de Une réalisée par Loguy /-)
Retrouvez notre dossier sur l’eau :
Eaux privatisées : la Bolivie fait barrage
«26% moins cher que Veolia et 6 fois plus d’investissement qu’avec le privé»
]]>
Dans Libération, le 17 janvier dernier, Emmanuel Todd explique que l’une des causes de la révolution tunisienne est à chercher dans la diminution de l’endogamie (les mariages entre cousins) et l’augmentation de l’alphabétisation. Cette analyse a été interprétée comme la preuve que l’on pouvait prédire les révolutions en regardant uniquement les statistiques. Formidable ! Construisons un indice de la probabilité de révolution !
Cette analyse marxienne (un adjectif inventé pour désigner ceux qui suivent les idées de Karl Marx sans avoir la connotation politique de marxiste), pense l’histoire comme une science exacte. Tout comme l’eau bout à 100°C à une pression de 100 kPa, on pourrait imaginer que les révolutions se déclenchent quand l’alphabétisation atteint 95%, le nombre d’enfants par femme descend à 2 et le taux d’endogamie à 20%.
Cette vision alléchante d’un monde obéissant à des règles connues ne tient pas la route. La première explication coule de source : si l’on pouvait prédire les révolutions, les despotes n’auraient qu’à regarder une série d’indicateurs pour conserver le pouvoir. Ce qu’ils font, dans une certaine mesure. En décembre dernier, Bouteflika, en Algérie, a augmenté de 50% le salaire des policiers, sentant sans doute la grogne monter chez ses voisins tunisiens. En janvier, après la fuite de Ben Ali, l’émir du Koweït a offert un chèque-cadeau de 1 700 euros à tous ses sujets, y compris les nouveau-nés (nés jusqu’au 1er février).
Surtout, si le modèle imaginé par Todd fonctionne dans le cas de la Tunisie et de Égypte, il n’explique absolument pas les révolutions Géorgiennes et Ukrainiennes de 2003 et 2004. Dans ces deux pays, les taux d’alphabétisation tournaient autour de 99% depuis des décennies et le nombre d’enfants par femme était largement inférieur à 2 depuis les années 1980.
On pourrait se dire que le modèle ne vaut que pour des pays de cultures similaires. Mais, là encore, difficile de voir une ‘culture arabe’ autre qu’imaginée. Le commerce entre Tunisie et Égypte, par exemple, est plus de 70 fois inférieur à celui entre la Tunisie et l’Union Européenne (pdf). Niveau culturel également, les Tunisiens semblent plus proches de la France que de l’Égypte. À en croire Google, ils s’intéressent autant à Amr Diab, le chanteur arabe pop ayant vendu le plus d’albums de tous les temps, qu’à nos très français Amel Bent et Charles Aznavour.
Le monde arabe existe surtout sous la plume des éditorialistes occidentaux et le modèle explicatif des révolutions saucé de culturalisme ne tient pas vraiment la route.
Un autre problème tient à la définition de la révolution. Parle-t-on de mouvements visant à un changement de régime ? A un changement de gouvernement ? A une diminution du prix du pain ?
La révolution de février 1917 en Russie commença par des exigences de nourriture et s’est terminée par la mise en place d’un régime diamétralement opposé au précédent. Même chose en septembre 1989 en Allemagne de l’Est. Les manifestants de Leipzig, lors des Montagsdemo, ne demandèrent pas tout de suite la fin du régime communiste.
Dès lors, que doivent trouver les modèles ? Prédire les changements de régime après-coup en imaginant des modèles ad-hoc, ou prévenir les émeutes ? Prédire le futur a posteriori est relativement facile. Prévoir les émeutes, c’est plus difficile.
Prenons celles des banlieues en France en 2005, ou celles de la Martinique en 2009. Si le taux de chômage des jeunes (entre 20% et 55% dans ces territoires) peut être un indicateur de troubles sociaux à venir, il ne détermine rien en soi. La ville d’Auchel (62), malgré un taux de chômage supérieur à celui de Clichy-sous-Bois (23% contre 21% en 2007), ne semble pas candidate aux émeutes urbaines.
On pourrait prendre en compte plein de variables (densité du tissu urbain, origine géographique des populations, proportion de francophones, état du marché du travail etc.) qu’on n’arriverait toujours pas à créer un modèle expliquant les émeutes en Seine-Saint-Denis, aux Antilles et leur quasi-absence dans le Pas-de-Calais. Une étude de l’université de Stanford montre d’ailleurs que le principal déterminant des émeutes reste les émeutes précédentes sur le territoire. En d’autres termes, plus une ville a vu d’émeutes par le passé, plus il est probable qu’il s’en produise une.
Surtout, les émeutes sont parfois l’affirmation d’une catégorie sociale pour laquelle il n’existe pas encore d’outils de mesure. De quelles statistiques dispose-t-on sur « les jeunes des banlieues » ? Sur les békés (Blancs) antillais ? La création de nouvelles catégories sociales nécessite, de la part des observateurs (dont les journalistes), de changer de grille d’analyse pour comprendre ce qu’il se passe (ce n’est pas la pauvreté qui déclenche l’émeute).
Ce travail a été fait en 1967 par le premier des datajournalistes, Philip Meyer. Il a montré que les émeutiers de Détroit n’étaient pas des jeunes sans éducation sans autre moyen de faire entendre leur voix, mais que les diplômés s’étaient autant révolté que les non-diplômés.
Sur les émeutes de 2005 en France, rien de tel de la part des journalistes. Quelques sociologues ont mené des enquêtes, mais n’ont testé que peu d’hypothèses, comme l’origine ou la taille des familles dans les communes révoltées (dans ce livre dirigé par Hughes Lagrange ; je n’ai pas trouvé de modèle statistique dans celui dirigé par Laurent Mucchielli). Il reste du boulot pour les journalistes, si nous ne voulons pas nous cantonner à des analyses au doigt mouillé et à faire écho aux sociologues.
Photos CC Wassim Ben Rhouma, Nocturnales
]]>
Voir World Map of Open Government Data Initiatives sur une plus grande carte.
Ces catalogues ne sont pas que des concessions faites à quelques activistes. Ils se développent, avec le soutien de certaines administrations. Data.gov, par exemple, a multiplié par 10 le nombre de séries de données disponibles sur le site depuis son lancement.
Tim Berners Lee, père fondateur de data.gov.uk et grand défenseur de l’opendata, est revenu l’année dernière sur la croissance phénoménale du nombre de données ouvertes. Internautes, entrepreneurs et administrations se saisissent des jeux de données pour les manipuler et, in fine, leur ajouter de la valeur.
Les perspectives ouvertes par les données publiques sont vertigineuses, comme l’a rappelé Xavier Crouan lors du CapCom de Rennes. Même à Paris, alors que le projet ParisData et ses 19 (!) jeux de données ont essuyé de nombreuses critiques lors du lancement, des internautes ont su mettre à profit cette nouvelle matière mise à leur disposition. Mounir et Simon ont produit en quelques jours une carte politique de la ville, où l’on voit à quel point les populations de droite et de gauche se mélangent peu.
Pourtant, ces initiatives ne changent pas grand-chose. Les catalogues de données représentent une avancée, mais ils ne relèvent pas vraiment d’une démarche d’ouverture et de transparence. Avec ces catalogues, l’administration décide toujours de ce qui est public et de ce qui reste sous clé.
L’argument selon lequel la croissance des jeux de données disponibles conduira à plus de transparence ne tient pas non plus. Il serait extrêmement cher de mettre en ligne l’ensemble des données produites par l’administration. Si chaque fonctionnaire en France n’écrivait que 10 000 signes de documents potentiellement publics par jour, on aurait déjà 50 gigas de données à mettre en ligne toutes les 24 heures. Sans compter les entreprises réalisant une mission de service public, qu’il faudrait inclure à ce total, ou encore les archives nationales.
L’approche par l’offre, telle qu’on la pense aujourd’hui, est également porteuse d’inégalités. On demande à l’administration de mettre en ligne des données, de préférence dans un format compréhensible par les machines, mais le citoyen est rarement le premier bénéficiaire de ces efforts. Tout le monde ne peut pas lire un tableau au format Excel ou une base de données organisée au format sémantique RDF, ce qu’exigaient certains défenseurs de l’opendata lors de l’Open Government Data Camp du 18 novembre dernier.
Pour caricaturer, on pourrait dire que les lobbyistes de l’opendata demandent à l’administration de dépenser l’argent du contribuable pour créer des bases de données. Or, celles-ci ont vocation à être utilisées en priorité par… les lobbyistes de l’opendata. Le contribuable, qui paye pour la mise en ligne des données, n’est pas le principal bénéficiaire de l’opération.
Aujourd’hui, les administrations sont au cœur du processus de publication des données. Nous les laissons décider elles-mêmes de la direction à prendre. Nous leur laissons le soin de s’autoréguler. Mais l’autorégulation n’est pas la panacée, surtout lorsqu’elle n’est pas assortie de sanctions. Les banques nous en ont offert un bel exemple lors de la crise des subprimes (voir cet article, ‘Self-regulation means no regulation’, pour les détails techniques). Dans l’industrie aussi, une étude (pdf) de plus de 4000 entreprises montre que les programmes d’auto-régulation n’ont pas beaucoup d’impact. L’administration fera peut-être exception à la règle, mais mieux vaut ne pas compter dessus.
L’ouverture des données publiques doit se faire par le bas, dans un processus bottom-up plutôt que top-down. C’est aux demandeurs de s’organiser pour transformer les données de l’administration en une base utilisable par les machines, pas aux contribuables. Mais c’est également à l’administration de s’adapter pour répondre aux besoins des demandeurs et fournir les données.
Les répertoires gérés par les réutilisateurs permettent déjà d’organiser les données publiques libérées, sans qu’une administration ne soit impliquée dans sa gestion. Qu’ils soient privés comme data-publica ou ouverts comme nosdonnées.fr, ils montrent que le problème ne tient pas à l’organisation des données – ils le font déjà – mais bien à la possibilité pour les citoyen de pouvoir demander un jeu de données. Fait révélateur, presque aucun des catalogues gérés par des administrations n’invite les utilisateurs à demander des données non-encore disponibles (la Suède fait exception).
Cette démarche, prévue par la loi, n’est pas défendue aujourd’hui. Pourtant, comme le montre l’enquête que nous avons réalisée auprès d’une vingtaine de collectivités, l’administration n’est absolument pas en mesure de respecter la loi de 1978 relative à l’accès aux documents administratifs.
Lorsqu’un journaliste, un chercheur ou un citoyen demande des données à l’administration, il se heurte presque systématiquement à un refus initial. S’il a la chance de connaître l’existence de la loi de 1978, il peut faire appel du refus de communication auprès de la CADA. Or, aujourd’hui, la CADA ne fait qu’appeler l’administration en question pour lui demander des explications, puis rend un avis.
Son budget de 1 million d’euros (6 fois moins que l’HADOPI) et ses 12 agents ne lui permettent pas de mener l’enquête lorsqu’une administration affirme ne pas détenir les données demandées. Elle n’a pas les moyens d’analyser en profondeur les 350 demandes mensuelles qu’elle reçoit (voir son excellent rapport d’activité au format pdf). Surtout, elle n’a pas de pouvoir de sanction – elle doit se borner à rendre des « avis ».
On comprend alors que si les données recherchées n’ont pas été gracieusement mises en ligne par l’administration, vos chances de les obtenir sont très minces.
Si l’ouverture des données par le haut reste une initiative louable, la transparence ne progressera que lorsque tous les fonctionnaires seront formés pour répondre aux demandes concernant les documents administratifs. Tout comme les standardistes des administrations disposent de pense-bête lorsqu’on leur demande les pièces nécessaires à l’établissement d’un passeport ou d’une carte grise, il devrait y avoir une marche à suivre pour satisfaire les demandes de documents administratifs.
Les données publiques, en France, ne seront réellement disponibles que lorsque :
D’ici là, les catalogues continueront à grossir, mais les données qui n’y figurent pas seront toujours aussi difficile à obtenir.
Illustration: Carte de New-York CC walkingsf
]]>72 heures plus tard, seule une administration nous a fait parvenir le document au format désiré, le Conseil Général du Lot. Les 21 autres avec lesquelles nous avons pu établir une communication téléphonique nous ont parfois rembarré, parfois renvoyé vers des documents pdf présents sur le site ou promis de nous envoyer le budget en question par e-mail.
La méconnaissance de la loi CADA n’est pas seule en cause. L’incapacité de certains fonctionnaires à comprendre les problématiques de l’ouverture des données publiques apparaît manifeste. Plusieurs interlocuteurs se sont montrés incapables de comprendre la nécessité d’avoir accès aux données dans leur globalité. On nous a parfois répondu :
Je vais vous envoyer le dossier de presse, vous aurez tout.
Dans plus de la moitié des cas, il nous a été répondu qu’il était impossible d’obtenir un fichier Excel ou csv. Parfois, le système informatique est seul coupable. Les solutions propriétaires achetées à prix d’or auprès des grands noms de l’informatique d’entreprise n’ont pas été conçues pour être compatibles avec le monde extérieur. Pour les collectivités concernées, les prestataires réclament des sommes pouvant aller jusqu’à 100 000€ pour ajouter une fonctionnalité d’export en csv.
Plus grave : le niveau de compétence informatique de certains fonctionnaires mène à des situations grotesques, où des fonctionnaires justifient leur refus de respecter la loi en étalant abondamment leur ignorance.
On ne donne que du papier. Pour que vous ne puissiez pas modifier les chiffres.
Ce genre de remarques, entendues régulièrement avec sa variante « les fichiers xls sont modifiables, pas les pdf », traduit un manque de confiance des administrations envers les journalistes. Surtout, elles montrent que certains fonctionnaires ne sont pas suffisamment formés à la compréhension des enjeux informatiques. Les fichiers pdf sont tout aussi éditables que les fichiers xls, qui peuvent être également verrouillés.
Dans cette enquête, la seule administration allant mettre en place un programme d’ouverture des données publiques est aussi celle chez qui les réponses ont été les plus farfelues. En effet, Nantes a annoncé en février son intention de participer au mouvement de l’opendata. Pourtant, l’interlocuteur que nous avons eu au service financier a tout d’abord tenté de nous renvoyer sur le site de la ville, où l’on trouve une version pdf du budget 2010 primitif répartie dans une quinzaine de documents différents.
Ces documents mentionnent l’existence de fichiers sources, mais on nous a opposé un refus formel de les communiquer. Pourquoi ? « Vous comprenez, tout le monde peut en faire n’importe quoi quand c’est pas du pdf ». Effectivement.
Retrouvez le document Google Doc recensant les réactions des administrations.
Enquête réalisée avec Ophelia Noor et Stan Jourdan.
Photo: Le tribunal de Nantes, CC telomi
Mise à jour 22 février 08:45 Nantes va se doter d’un programme d’ouverture des données publiques, mais ne l’a pas encore fait. Merci @LiberTIC.
]]>