Journalisme de données

Un article de Wikipédia, l'encyclopédie libre.

Le journalisme de données (data journalism en anglais), ou journalisme de bases de données (database journalism), est un mouvement visant à renouveler le journalisme par l'exploitation de données statistiques et la mise à la disposition de celles-ci au public[1].

Il est également lié à la libre disponibilité des données : de plus en plus de données statistiques sont diffusées par les institutions et les gouvernements, et un journaliste d'investigation sachant les analyser peut mettre en lumière des faits importants comme cela a été le cas dans le scandale des notes de frais des parlementaires britanniques[2].

La question de la visualisation de données est également un aspect important de ce type de journalisme.

Définition[modifier | modifier le code]

Pour Adrian Holovaty, l'un des chefs de file du mouvement, le travail du journaliste traditionnel consiste essentiellement à collecter des données. Alors que ce dernier dissémine les données (les informations) qu'il a obtenues dans un texte rédigé, le journaliste de données les collecte sous forme structurée afin de pouvoir ensuite les réutiliser plus facilement à des fins de comparaison[3].

Simon Rogers, auparavant responsable du journalisme des données au Guardian, fait une différence entre le journalisme de données et l'infographie. Pour lui, l'infographie consiste uniquement à présenter des chiffres alors que le journalisme de données consiste à les présenter mais aussi à les analyser et les expliquer[4].

À l'inverse du journaliste classique qui protège ses sources, le journaliste de données donne accès aux données au plus grand nombre. Simon Rogers compare l'esprit du journalisme de données à l'esprit punk qui dans les années 1970 encourageait chacun à prendre un instrument et à en jouer[5].

Sylvain Parasie propose l'expression « journalisme hacker » (en anglais hacker journalism), censé rapprocher les passionnés d'informatique (hackers, litt. « pondeurs de code », « bidouilleurs ») et les journalistes (hacks, litt. « journaleux », « plumitifs ») pour faire évoluer le journalisme[3].

Histoire[modifier | modifier le code]

Le journalisme de données est aussi ancien que l'exploitation des données.

Dès 1822, on trouve dans le Manchester Guardian un tableau de données sur les écoles de Manchester et Salford contenant des informations sur le nombre d'élèves dans chaque école et les dépenses annuelles de chacune des écoles[6],[7],[8].

La carte du choléra à Londres en 1854, dressée par John Snow.

Pour le journaliste du Guardian, Simon Rogers, la carte du cholera proposée par John Snow en 1854 est un exemple de journalisme de données. La carte, qui montre la concentration de choléra autour des pompes à eau, a permis de comprendre l'origine de l'épidémie[9].

Diagramme des causes de mortalité au sein de l'armée en Orient par Florence Nightingale.

En 1858, Florence Nightingale publie des données sur la mortalité des soldats dans l'armée britannique. Pour le journaliste du Guardian Simon Rogers, cela constitue un des premiers exemples de journalisme de données[6].

Dans les années 1950 se développe le computer-assisted reporting (en) (le journalisme assisté par ordinateur). Par exemple, la chaîne de télévision américaine CBS collecte des données pour pouvoir prédire les résultats des élections américaines[8].

Dans les années 1970, Philip Meyer propose la notion de « journalisme de précision » qui vise à utiliser les méthodes des sciences sociales et comportementales dans le journalisme[8].

Le journaliste américain Bill Dedman (en) reçoit le prix Pulitzer en 1989 pour une étude statistique montrant que les noirs obtiennent moins de crédits bancaires que les blancs à Atlanta[10].

À partir des années 2000, le développement de l'informatique permet la démocratisation de l'accès aux bases de données et le développement d'un véritable « journalisme de données ». Plusieurs médias anglo-saxons ont investi ce domaine[3].

En , Adrian Holovaty publie un texte manifeste intitulé A fundamental way newspaper sites need to change, dans lequel il défend l'idée que les journalistes devraient publier des données sous forme structurée de manière qu'elles puissent faire l'objet d'une analyse statistique[8],[11].

À partir de , le journaliste Simon Rogers anime pour The Guardian le « datablog » qui coordonne les travaux relevant du journalisme de données[12].

En , se tient la première conférence consacrée au journalisme de données à Amsterdam dans les locaux du European Journalism Centre (en). La conférence rassemble près de 60 journalistes venant du monde entier[8],[13].

En , lors du festival annuel Mozilla, plusieurs acteurs du système se réunissent sous l'égide du European Journalism Centre (en) et de la Open Knowledge Foundation pour rédiger un manuel de journalisme de données, publié en 2012 sous le titre Data Journalism Handbook[14],[15]. Ce manuel est traduit en français en 2013 par la société Journalism++(en) et diffusé en licence Creative Commons[16],[17].

En 2012, deux journalistes du Seattle Times, Michael J. Berens et Ken Armstrong, sont récompensés du prix Pulitzer du journalisme d’investigation pour un travail relevant du journalisme de données montrant qu'un grand nombre de décès dans l'État de Washington était lié à une surdose de méthadone, anti-douleur prescrit aux bénéficiaires de Medicaid pour des raisons d'économie[18].

En France[modifier | modifier le code]

En 2010, le pure player indépendant OWNI popularise cette pratique. Premier partenaire français de WikiLeaks, OWNI publie les carnets de guerre de l'armée américaine en Irak[19],[20]. En 2011, Pierre Romera et Nicolas Kayser-Bril, deux anciens d'OWNI[21], lancent Journalism++(en), une société de services spécialisée dans le journalisme de données[22]. C'est à elle que l'on doit notamment les Migrants Files, une enquête internationale visant à évaluer le coût humain et financier des politiques anti-migratoires en Europe[23],[24], récompensée de plusieurs prix comme le GEN Data Journalism Award en 2014[25] et l’European Press Prize en 2015[26].

L'émission DataGueule, ouverte en 2014 par Julien Goetz, est une Web-série hebdomadaire diffusée sur France 4 et sur YouTube et Dailymotion. Le principe de l'émission est de « déconstruire des mécanismes, avec de l'humour et si possible un prisme historique (…) des sujets où l'on se rend compte que ça ne tourne pas rond. Même s'il faut les décortiquer pour comprendre exactement ce qui ne tourne pas rond »[27].

En 2013, le magazine Paris Match lance Data Match, une page spécifique intégrée à sa rubrique "Match de la semaine". En 2014, le journal Le Monde lance la rubrique Les Décodeurs, dédiée au fact-checking[28]. En 2015, le journal Libération lance la rubrique Six Plus dédiée au journalisme de données[29] qui a été renommée Libé Labo début 2019[30].

En 2019, alors que la visualisation de données est devenu une pratique usuelle dans le journalisme, un article propose une expérience de représentation sonore de données à partir des chiffres de la cote de popularité du président Macron[31].

Les journalistes d'investigation ont eu à partir des années 2010 à disposition des fonctionnalités nouvelles[32] qui permettent de faire du tri, du classement, du traitement de données en grande quantité[32], ce qui apportent à leurs rédactions un niveau de maîtrise du matériau journalistique (statistiques, études, enquête…) « assez proche de celui de certains statisticiens »[32] et permettant en même temps des « démarches jusque-là plutôt réservées à des infographistes »[32], a estimé le journaliste d'investigation Sylvain Lapoix, spécialiste du journalisme de données[32]. Ces matériaux disponibles donnent un nouveau potentiel et une crédibilité supplémentaire au journalisme d'enquête[32], car la donnée devient « le terreau et le fondement de l’enquête » pour aller plus loin dans la connaissance[32]. Les millions de données réunies dans les dossiers « Paradise Papers » et « Panama Papers » pour épingler certains paradis fiscaux, restent cependant encore des initiatives pionnières voire isolées, alors que la « data », loin de minimiser le rôle du journaliste, renforce son analyse, a tempéré Bruno Breton, PDG de Bloom, dans Les Échos[33].

L'afflux de données, jugé parfois « exponentiel », arrivant sur Internet et d'autres supports numérisés, notamment les archives numérisées des journaux et des institutions, ou encore les fuites massives comme les télégrammes diplomatiques de l’administration américaine révélés par WikiLeaks entre 2010 et 2011, a suscité une nouvelle donne numérique pour les journalistes d’investigation, qui ont réagi de différentes manières : certains « coopèrent aux quatre coins du monde, développent de nouvelles stratégies et s’appuient sur des outils informatiques puissants » afin d'exploiter et traiter les données fournies par un lanceur d’alerte ou un autre[34].

Distinctions[modifier | modifier le code]

Depuis 2012, le Global Editor Networks (en) organise les Data Journalism Awards[35] (oscars du journalisme de données).

Exemples[modifier | modifier le code]

Aux États-Unis, The Texas Tribune (en) met à la disposition de ses lecteurs une base de données contenant les salaires de 667 000 employés du secteur public. L'article contient un lien vers les données brutes mais aussi des visualisations avec un histogramme de la distribution des salaires et des tableaux montrant le salaire moyen, médian, maximum et minimum en fonction de la nature de l'emploi et de l'employeur[36],[37].

En France, pendant la campagne électorale pour l'élection présidentielle de 2012, la chaîne de télévision iTélé et le site web d'information OWNI ont mis en place un outil intitulé le « véritomètre » permettant de confronter les chiffres avancés par les différents candidats pendant la campagne avec la réalité[38].

Le Wall Street Journal a mis en place, à la disposition du public, une base de données sur les statistiques de la criminalité aux États-Unis entre 2000 et 2010[39],[40].

À partir de 2017, le média pan-européen Voxeurop se lance dans le datajournalisme par la publication d'articles réalisés dans le cadre du European data journalism network (EDJNet)[41],[42]. D'autres médias sont partenaires de cette initiative comme Alternatives économiques, Spiegel Online, EUobserver et El Confidencial[43].

En 2017, le Consortium international des journalistes d'investigation et ses partenaires dévoilent les résultats d'un an d'enquête dans le cadre des Paradise Papers. À la pointe des techniques du journalisme de données, ces révélations se basent sur une immense fuite de plus de 13,5 millions[44] de documents confidentiels notamment issus du cabinet d'avocats Appleby, détaillant des informations sur des sociétés offshore. Parmi eux se trouvent des multinationales et de nombreuses personnalités de la vie publique[45],[46],[47].

Critiques[modifier | modifier le code]

Dans Le Monde diplomatique, Giulio Frigieri déplore que de nombreuses infographies privilégient l'aspect esthétique sur l'intelligibilité[48].

En 2014, plusieurs éditeurs de logiciels[49] commercialisent des robots rédigeant automatiquement des articles sur la base de grands volumes de données[50].

Dans les années à venir, ceci pourrait limiter le travail du journaliste de données à une activité de reformulation ou d'analyse[51].

Bibliographie[modifier | modifier le code]

  • (en) Paul Bradshaw, Scraping for Journalists, Leanpub, (présentation en ligne)
  • Sophian Fanen, « Le journalisme les doigts dans les données », Libération,‎ (lire en ligne)
  • (en) Jonathan Gray, Lucy Chambers et Liliana Bounegru, Data Journalism Handbook, O'Reilly Media, , 220 p. (ISBN 978-1-4493-3006-4, lire en ligne)
  • Jonathan Gray, Liliana Bounegru, Lucy Chambers, Nicolas Kayser-Bril, Collectif Eyrolles (trad. de l'anglais), Guide du datajournalisme : collecter, analyser et visualiser les données, Paris, Eyrolles, , 220 p. (ISBN 978-2-212-13685-2, lire en ligne)
  • (en) John Herbert, Journalism in the Digital Age : Theory and Practice for Broadcast, Print and On-Line Media, Focal Press, , 349 p. (ISBN 978-0-240-51589-2)
  • Alain Joannès, Data journalisme : Bases de données et visualisation de l'information, Paris, CFPJ Éditions, , 169 p. (ISBN 978-2-35307-037-4)
  • (en) David McCandless, Information is Beautiful : The Information Atlas, Collins,
  • (en) Philip Meyer, Precision Journalism, Indiana University Press, , 342 p. (ISBN 978-0-253-20163-8)
  • Sylvain Parasie et Éric Dagiral, « Portrait du journaliste en programmeur : L'émergence d'une figure du journaliste hacker », Les cahiers du journalisme, nos 22-23,‎ (lire en ligne)
  • (en) Simon Rogers, Facts are Sacred : The power of data, Guardian Books, , 92 p.
  • (en) David Weaver et Maxwell McCombs, « Journalism and Social Science: A New Relationship? », Public Opinion Quarterly, vol. 44, no 4,‎ (DOI 10.1086/268618, lire en ligne)
  • Liu Yikun et Dong Zhao (trad. de l'anglais), La datavisualisation au service de l'information, Paris, Pyramyd, , 240 p. (ISBN 978-2-35017-389-4)

Filmographie[modifier | modifier le code]

Notes et références[modifier | modifier le code]

  1. Nicolas Vanbremeersch, « Pour un journalisme de données », Slate.fr,‎ (lire en ligne)
  2. (en) Daily Telegraph.
  3. a b et c Sylvain Parasie, « Le journalisme « hacker » : Une nouvelle utopie pour la presse ? », La Vie des idées,‎ (lire en ligne)
  4. Sophian Fanen, « WikiLeaks a changé la vision des rédactions : Entretien avec Simon Rogers », Libération,‎ (lire en ligne)
  5. (en) Simon Rogers, « Anyone can do it. Data journalism is the new punk », The Guardian,‎ (lire en ligne)
  6. a et b (en) Simon Rogers, « Data journalism at the Guardian: what is it and how do we do it? », The Guardian,‎ (lire en ligne).
  7. (en) Simon Rogers, « The first Guardian data journalism: May 5, 1821 », The Guardian,‎ (lire en ligne).
  8. a b c d et e (en) Liliana Bounegru, « Data Journalism in Perspective », dans Data Journalism Handbook, (lire en ligne).
  9. (en) Simon Rogers, « John Snow's data journalism: the cholera map that changed the world », The Guardian,‎ (lire en ligne).
  10. Sophian Fanen, « Les Américains défricheurs du déchiffrage », Libération,‎ (lire en ligne).
  11. (en) Adrian Holovaty, « A fundamental way newspaper sites need to change », holovaty.com,‎ (lire en ligne).
  12. Pablo René-Worms, « Les coulisses du journalisme de données », Le Point,‎ (lire en ligne).
  13. (en) Nicolas Kayser-Bril, « Reasons to cheer from Amsterdam’s Data-Driven Journalism conference », journalism.co.uk,‎ (lire en ligne).
  14. (en) « Featured Guide: Data Journalism Handbook - A New Approach To Storytelling », Rising Voices,‎ (lire en ligne)
  15. (en) Federica Cocco, « Hacks and hackers gather to write the first Data Journalism Handbook », Data Driven Journalism,‎ (lire en ligne).
  16. « Guide du datajournalisme », sur eyrolles.com (consulté le )
  17. « Guide du datajournalisme », sur jplusplus.github.io (consulté le )
  18. « Le journalisme de données récompensé », Courrier international,‎ (lire en ligne).
  19. « DOCUMENTS SECRETS - OWNI, la plate-forme française qui a aidé WikiLeaks », Le Point,‎ (lire en ligne, consulté le )
  20. Antoine Mairé, « Comment les Français d’Owni ont aidé WikiLeaks à faire courir la fuite », Télérama,‎ (lire en ligne, consulté le )
  21. Nicolas Kayser-Bril, « “Allô, c’est Julian Assange” », sur owni.fr, (version du sur Internet Archive)
  22. « Rencontre avec deux journalistes++ », Atelier des médias,‎ (lire en ligne, consulté le )
  23. « Une carte recense les migrants et réfugiés morts sur les routes de l’Europe », sur Le Monde.fr (consulté le )
  24. « La Tunisie en "bonne place" sur la carte des naufrages les plus meurtriers en Méditerranée », Al HuffPost Maghreb,‎ (lire en ligne, consulté le )
  25. (en) Alison Langley, « European Union journalists cross borders for story collaboration », Columbia Journalism Review,‎ (lire en ligne, consulté le )
  26. (en-US) « 2015 - European Press Prize », sur europeanpressprize.com, (consulté le )
  27. « #DataGueule : les coulisses de l’émission », Nil Sanyas,‎ (lire en ligne, consulté le )
  28. « Pour les Décodeurs du journal Le Monde, "l'objectif c'est de trouver la source" », RTBF Info,‎ (lire en ligne, consulté le )
  29. « Le data-journalisme, un journalisme d'investigation qui s'ignore (INTERVIEW) », sur french.xinhuanet.com (consulté le )
  30. « Six Plus devient Libé Labo », sur Libération.fr, (consulté le )
  31. « Avez-vous déjà écouté la petite musique d'une cote de popularité ? », sur Libération.fr, (consulté le )
  32. a b c d e f et g "Le data journalisme : entre retour du journalisme d'investigation et fétichisation de la donnée". Entretien avec le journaliste d'investigation Sylvain Lapoix, par Samira Ouardi, dans la revue Mouvements en 2014 [1]
  33. "Le data journalisme, une chance pour la presse" par Bruno Breton, PDG de Bloom, Les Échos, 24 mai 2018 [2]
  34. "Face à l’immensité du Big Data, les stratégies des journalistes d’investigation", par Léopold Picot sur RFI le 07/11/2021 [3]
  35. « Data Journalism Awards » (consulté le )
  36. (en) « Government Employee Salaries », sur The Texas Tribune (consulté le )
  37. (en) Simon Rogers, « Some Favorite Examples », dans Data Journalism Handbook, (lire en ligne)
  38. Nicolas Patte, « Le Véritomètre de la présidentielle », OWNI,‎ (lire en ligne)
  39. (en) « Murder in America », sur Wall Street Journal (consulté le )
  40. « États-Unis : des chiffres et des meurtres », Les Inrockuptibles,‎ (lire en ligne)
  41. (en) « VoxEurop / Sources / Home - edjnet », sur europeandatajournalism.eu (consulté le )
  42. « Un nouveau réseau de datajournalisme européen », sur voxeurop.eu/fr (consulté le )
  43. « Un nouvel outil pour comprendre l’Europe », sur voxeurop.eu/fr (consulté le )
  44. (en-US) Pierre Romera et Cécile S. Gallego, « How ICIJ deals with massive data leaks like the Panama Papers and Paradise Papers », ICIJ,‎ (lire en ligne, consulté le )
  45. (de) « Das sind die Paradise Papers », Süddeutsche Zeitung,‎ (lire en ligne, consulté le )
  46. (en-GB) Paradise Papers reporting team, « Tax haven secrets of ultra-rich exposed », BBC News,‎ (lire en ligne, consulté le )
  47. (en) Mike McIntire, Sasha Chavkin et Martha M. Hamilton, « Commerce Secretary’s Offshore Ties to Putin ‘Cronies’ », The New York Times,‎ (lire en ligne, consulté le )
  48. Giulio Frigieri (trad. Isabelle Boski), « L’infographie dans la production du savoir », Le Monde diplomatique,‎ (lire en ligne)
  49. tels que Melty, Narrative Science (en) et Automative Insights
  50. Après l'informatisation et la numérisation, la robotisation
  51. Chez « Associated Press », le robot repère et le journaliste analyse

Articles connexes[modifier | modifier le code]