Data journalism een term die je mag onthouden en waar elke would-be student journalistiek (en ook IT’ers met interesse in journalistiek) maar eens wat research over moet doen.
Enige tijd geleden zag ik ergens dit boek “The Data Journalism Handbook” (220 blz -> Bol.com – ProxisAzur.be) op twitter verschijnen (die tweet vind ik natuurlijk niet meer terug, tot zover mijn data journalism 😉 ): .
2 soorten journalistiek:
Wat je momenteel ziet in onze hedendaagse media zijn 2 volledig uit elkaar gaande soorten van journalistiek:
1. copy/paste/herkauw journalistiek: Belga en andere streams afspeuren en onder druk van de pageviews vooral schrijven over onderwerpen, waarmee je garandeert gaat scoren. Ook de druk van adverteerders en overkoepelende mediabedrijven is een belangrijke trend hierbij.
2. Data en research journalistiek: Zelf in de massale hoeveelheid aan data gaan zoeken naar verbanden. Enkele goede voorbeelden hiervan:
- De Tijd: Mijn favoriete weekendkrant, die aan de hand van bvb. de Graydon bestanden op zoek gaat naar fiscale constructies en dit meer en meer in zeer goede infographics gaat tonen en uitleggen. Voor hun content betaal ik met veel plezier.
- The guardian: Hulde aan hun werk omtrent Wikileaks, Snowden vs. NSA, de Londen riots…
- Oorlogsjournalisten zoals Rudy Vranckx en Harald Doornbos, die niet enkel de mediagenieke momenten weergeven, maar op het terrein ook dieper gaan zoeken. Zo heb ik met veel interesse de berichtgeving van Harald gevolgd omtrent de Koerden in N-Syrië, die zonder veel aandacht een eigen staat aan het oprichten zijn in de heersende burgeroorlog met o.a. gelijkheid tussen man en vrouw en religie.
Pas op ook in de blogwereld en op tech websites, kan je duidelijk dit onderscheid maken. Ik hoop dat ik met de nieuwere richting van dailybits.be me meer uit het copy/paste/herkauw gedeelte probeer te krijgen.
Het boek: The Data Journalism Handbook
Het feit dat het boek is uitgegeven in de O’Reilly reeks moet vele geeks/IT-guys al een belletje doen rinkelen. De O’Reilly boeken zijn gekend als de beste, meest diepgravende boeken in vele IT onderwerpen. Het is dan ook geen vlot lezend boek, maar een echt technisch boek (waar je je tijd voor moet nemen).
Het boek, The Data Journalism handbook, gaat aan de hand van concrete data journalism projecten bij o.a. de BBC, The Guardian, The Chicago Tribune,…worden de verschillende aspecten van dit vak binnen de journalistiek belicht.
Zo worden de stappen voor het verzamelen van gegevens via web scraping of het extraheren van data uit pdf bestanden ( via Nitropdf of ABBYY FineReader).
1 van de cases is hoe The Guardian is gestart met het verwerken van de gekende Wikileaks War Logs. Een spreadsheet met 92.201 rijen aan militaire events in Afghanistan. De eerste stap voor het team was het omvormen van deze excel in een SQL database, zodat alle reporters er eenvoudiger zoekopdrachten op konden gaan doen. Vanuit mijn vroegere job van MS SQL server database consultant is het lezen van deze werkwijze natuurlijk muziek in mijn oren.
Via deze methode kon het team verder kijken dan de individuele events en werd de opmars van de IED (bermbommen) zichtbaar doorheen de data. Deze kennis van het verwerken van de data kwam goed van pas, daar in 2010 Wikileaks nog eens een bestand van maar liefst 391.000 warlogs vanuit Irak.
Hierdoor heeft het team bij The Guardian (met zowel journalisten, backend IT’ers als frontenders) volgende infographics uit de vele duizenden lijnen in de originele excel laten groeien.
Doorheen het boek kom je dus vele handige tools tegen: van blekko.com over het aanleren van de programmeertaal Python tot het belang van Excel (met de gekende 65k rule bij oudere excel versies).
1 van de leukere zaken, waar ikzelf eens mee ga experimenteren zijn Google Fushion tables, waarmee je spreadsheets in Google docs eenvoudig kan visualiseren.
Kleinere voorbeelden bij ons
Het moeten niet steeds super belangrijke wereldevents zijn die via een vorm van data journalism, dienen te worden belicht.
Enkele leuke kleine voorbeelden, die ikzelf wel leuk vond de afgelopen maanden:
- Data visualisatie tool van Het Nieuwsblad: Wat zijn de rijkste wijken in je gemeente?
- visualisatietool van Knack: Wat kost een avondje voetbal in de Jupiler Pro league?
Mooie samenwerkingen tussen het verzamelen van data en dan de IT/design-afdeling om er nog iets leuks mee te maken.
Meer info over Data Driven Journalism?
Als je interesse hebt in Data journalism kan ik zeker volgende Nederlandse journalist op Twitter aanbevelen: @henkvaness. Bijna dagelijks brengt hij leuke tweets en links over dit onderwerp.
https://twitter.com/henkvaness/status/343287203797032960
https://twitter.com/henkvaness/status/351666834979815425
https://twitter.com/henkvaness/status/340408549043744770
https://twitter.com/henkvaness/status/369520293972172800
Henk Van Ess heeft blijkbaar zelf ook een Nederlands boek over dit onderwerp geschreven:
https://twitter.com/henkvaness/status/369727431315173376
Avondopleiding onderzoeksjournalistiek bij Lessius Mechelen
Bij Thomas More Mechelen (waar ik mijn Bachelor IMS heb behaald) starten ze nu een postgraduaat internationale onderzoeksjournalistiek. Het ziet er een super avondopleiding uit met wekelijks 2*3uur les van o.a. Rudi Vranckx (VRT), Gie Goris (MO*), Peter Verlinden (VRT),… (meer info over de opleiding).
Als Seppe niet in ons leven was gekomen, zou er veel interesse van mij geweest zijn om deze avondopleiding te gaan volgen. Ik voel namelijk dat het uitwerken van grotere casestudy blogposten me steeds meer en meer plezier begint te geven ipv. de snelle copy/paste blogpostjes.
Dit boek is dus een leuke must-read voor alle journalisten/it’ers met interesse in dit onderwerp. Verwacht geen vlot lezend boek voor op vakantie, maar een technisch boek met de werkwijze in tientallen data journalism projecten.
Dat data journalism omtrent wikileaks en de Snowden leaks niet echt in dank wordt afgenomen door de US/UK blijkt weer uit alle events van de afgelopen dagen tov. The Guardian:
http://www.theguardian.com/commentisfree/2013/aug/19/david-miranda-schedule7-danger-reporters
Benieuwd of onze media, hierover iets gaan publiceren…
Nog een super mooi data visualisatie projectje omtrent de scharnieren van de zeevaart: http://www.mo.be/de-scharnieren-van-de-wereldzeevaart-kaart
Bedankt voor het compliment over mijn kaartje over de scharnieren van de zeevaart, Herman.
Ik wou je ook nog even wijzen op mijn blog http://maartenlambrechts.drupalgardens.be Daarop heb ik het onder andere over het Datajournalism Handbook en het Handboek datajournalistiek , naast vele andere (goede en slechte) voorbeelden van datajournalistiek in binnen- en buitenland.
Ik geef in november ook een gastcollege aan de postgraduaat IRJ onder de titel ‘Datavisualisatie voor journalisten’. Zie http://researchjournalist.wordpress.com/colleges/datavisualisatie-voor-journalisten-maarten-lambrechts/
Whow blog voor in mijn feedly.
http://maartenlambrechts.drupalgardens.com/content/giet-je-content-eens-een-kaart-app
The Guardian geeft nog eens een waanzinnige mooi voorbeeld van data journalism:
http://www.theguardian.com/world/interactive/2013/nov/01/snowden-nsa-files-surveillance-revelations-decoded#section/3