Sie sind auf Seite 1von 228

' n e t o p f j i v t e m d 'Ner lijking van de werkwijze en

Jan Kruidhof ersiteit Groningen e ti p ri c rs te s a M / Rijksuniv k e ti s li a rn u jo r Maste .R.J. Pleijter A r. D r: e id le e g Hoofdbe

en t s li a n r u jo Een verge a t a d e s d n la r e d e N n routines va

'Nerd met vijf poten'


Een vergelijking van de werkwijze en routines van Nederlandse datajournalisten

Masterscriptie Jan Kruidhof Master journalistiek Rijksuniversiteit Groningen Hoofdbegeleider: Dr. A.R.J. Pleijter Tweede versie Inleverdatum: 29 januari 2013

NERD MET VIJF POTEN

MASTERSCRIPTIE JAN KRUIDHOF

De grote illustratie op de voorpagina is een still uit Nederland van Boven. De onderste illustratie is gemaakt door Frdrik Ruys en verscheen bij het artikel: Dolf Rogmans, 'Cijfers brengen de mierenhoop tot leven' Villamedia (21-10-2011).

NERD MET VIJF POTEN

MASTERSCRIPTIE JAN KRUIDHOF

Inhoudsopgave
6 9 10 14 16 19 20 21 24 26 27 28 Hoofdstuk 1: Inleiding Hoofdstuk 2: Theoretisch kader 2.1: Is een databestand journalistiek? 2.2: Wat is datajournalistiek? 2.3: Computer Assisted Reporting (CAR) 2.3.1 Verschil CAR en datajournalistiek 2.4: Pioniers in Nederland 2.5: Actueel overzicht datajournalistiek in Nederland 2.5.1 Internet 2.5.2 Kranten 2.5.3 Radio en televisie Hoofdstuk 3: Workflows en routines 3.1: Basiselementen van journalistieke workflow 3.2: The inverted pyramid of data journalism 3.2.1: Samenstellen 3.2.2: Opschonen 3.2.3: Contextualiseren 3.2.4: Combineren 29 31 32 33 34 35 38 3.3: De workflow van The Guardian 3.4: Workflows wereldwijd 3.5: Mirko Lorenz 3.6: Nederland van Boven 3.7: Luuk Sengers 3.8: Waar te beginnen? 3.9: Routines Hoofdstuk 4: Methode 4.1 De respondenten

NERD MET VIJF POTEN

MASTERSCRIPTIE JAN KRUIDHOF

40 42 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61

4.2 De interviews 4.3 Analyse van de interviews 4.4 Themas 4.5 Kwaliteit van het onderzoek Hoofdstuk 5: Onderzoeksresultaten 5.1: Doelstelling 5.1.1: Nieuwswaarde als harde eis 5.1.2: Nieuws niet het enige doel 5.1.3: Visualiseren makkelijker dan data vinden 5.1.4: Persoonlijk maken 5.2: Onderwerpen 5.2.1: Tijdgebrek 5.2.2: Beschikbaarheid en aandacht 5.2.3: Veel soorten onderwerpen 5.2.4: Televisie stelt eisen aan datajournalistiek 5.2.5: Multimediaal project is dwingend 5.2.6: Persoonlijk 5.3: Samenwerken met andere partijen 5.3.1: Voor wat hoort wat 5.3.2: Crowdsourcing 5.3.3: Pogingen tot crowdsourcing 5.3.4: Bedrijven 5.3.5: Obstakels bij samenwerking met bedrijven 5.4: Organisatie 5.4.1: Invloed van hoofdredactie 5.4.2: Geen hulp van collegas 5.4.3: Wel hulp van collegas 5.4.4: Omvang NOS voor- en nadeel 5.4.5: Vormgeving 5.4.6: Vrijwilligersorganisatie 5.5: Medewerkers 5.5.1: Niet echt datajournalist 5.5.2: Vereiste talenten

NERD MET VIJF POTEN

MASTERSCRIPTIE JAN KRUIDHOF

62 63 64 65 66 67 69 70 71 72 73 74 75 76 77 78

5.5.3: Ideale team 5.5.4: Programmeerkennis 5.6 Werkwijze 5.6.1: Workflow 5.6.2: Meer structuur in workflow NOS 5.6.3: Routines 5.6.4: Het begin 5.6.5: Verkrijgen van data lastig? 5.6.6: CBS 5.6.8: Zelf data verzamelen 5.6.9: Data verkrijgen middels WOB 5.6.10: Data verkrijgen middels scrapen 5.6.11: Checken en opschonen 5.6.12: Data bevragen 5.6.13: Presenteren 5.6.14: Gratis tools 5.6.15: Consequent visualiseren

79 84 91 96 118 147 165 179 202 219

Hoofdstuk 6: Conclusie Literatuurlijst Topiclijst interviews Transcripties Dimitri Tokmetzis (Sargasso) Arlen Poort (NRC Handelsblad) en Laura Wismans (nrc.next) Jerry Vermanen (Nu) Anke Vellenga (NOS) Jasper Koning (Nederland van Boven) Erik Bloem (Altijd Wat) Andr Tak (RTL Nieuws)

NERD MET VIJF POTEN

MASTERSCRIPTIE JAN KRUIDHOF

1. Inleiding
Datajournalistiek is hot, kopte de website van de Vereniging van Onderzoeksjournalisten in december 2011.1 De journalistiek redden? Data! stond een paar maanden later op De Nieuwe Reporter.2 Data-driven journalism is the future, stelde Tim Berners-Lee, de bedenker van het web.3 De Universiteit van Tilburg besloot een master datajournalistiek aan te bieden en volgens Laurens Verhagen - hoofdredacteur van de websites van de Volkskrant, Het Parool, Trouw en De Morgen - is datajournalistiek binnenkort onmisbaar: Ik verwacht nog hele mooie dingen te zien. Je kunt straks niet meer zonder datajournalistiek.4 De afgelopen jaren waren al verschillende spraakmakende, verrassende en buitengewoon fraaie datajournalistieke producties te zien. De Britse krant The Guardian zette 1,2 miljoen bonnetjes van Lagerhuisleden online en gaf de bezoekers van haar site de mogelijkheid om de declaraties door te spitten. Verdachte gevallen konden aan de redactie gemeld worden en zo werden bonnetjes voor onder meer een nieuwe tv, een mollenvanger, beddengoed en de renovatie van een tweede huis ontdekt.5 De Amerikaanse krant The Washington Post bracht met het project Top Secret America overzicht aan in het enorme netwerk van Amerikaanse overheidsorganisaties en private bedrijven die verspreid over meer dan 10.000 locaties werken aan topgeheime operaties.6 Ook in Nederland kwamen steeds meer datajournalistieke projecten van de grond. Het VPROtelevisieprogramma Nederland van Boven combineerde helikopterbeelden, satellietfotos en GPS-gegevens van de krioelende mierenhoop die Nederland is met datavisualisaties over

Datajournalistiek is hot, Vereniging van Onderzoeksjournalisten (08-12-2011) http://www.vvoj.nl/cms/2011/12/08/datajournalistiek-is-hot/. 2 Laura Wismans, De journalistiek redden? Data! De Nieuwe Reporter (27-04-2012) http://www.denieuwereporter.nl/2012/04/de-journalistiek-redden-data/. 3 Charles Arthur, 'Journalists of the future need data skills, says Berners-Lee' The Guardian (19-11-2010) www.guardian.co.uk/technology/organgrinder/2010/nov/19/berners-leejournalism-data. 4 Jerry Vermanen, Nederland heeft een data-primeur nodig De Nieuwe Reporter (27-042012) http://www.denieuwereporter.nl/2012/04/nederland-heeft-een-data-primeur-nodig/. 5 Investigate your MPs expenses, The Guardian http://mps-expenses.guardian.co.uk/; Titia Ketelaar, Bonnetjesschandaal bij de Britten nrc.next http://www.NRCnext.nl/blog/2009/05/16/bonnetjesschandaal-bij-de-britten/; MPs expenses in the news http://bit.ly/PTk5Q8 6 Top Secret America The Washington Post (18-07-2010) http://projects.washingtonpost.com/top-secret-america/.

NERD MET VIJF POTEN

MASTERSCRIPTIE JAN KRUIDHOF

aspecten uit het dagelijks leven en hield daarmee meer dan een miljoen kijkers per aflevering aan de buis gekluisterd.7 Ondanks dat datajournalistiek steeds meer wordt bedreven en besproken is het nog niet gemakkelijk om te omschrijven wat het werkveld precies inhoudt. Both data and journalism are troublesome terms, geeft journalist en docent Paul Bradshaw toe in The Data Journalism Handbook, dat in april 2011 verscheen.8 It represents the convergence of a number of fields which are significant in their own right from investigative research and statistics to design and programming. The idea of combining those skills to tell important stories is powerful but also intimidating.9 Die hoeveelheid mogelijkheden is enerzijds een prachtige ontwikkeling. Gathering, filtering and visualizing what is happening beyond what the eye can see has a growing value, schreef de Duitse journalist Mirko Lorenz.10 Anderzijds kan de overdaad aan mogelijkheden een journalist ook overweldigen. Hoe pak je nu een onderwerp aan? Ga je met een scherp afgebakende vraag op pad of importeer je een dataset in Excel en schudt je net zo lang tot er iets interessants uitrolt? Moet je als journalist leren programmeren of schakel je een externe programmeur in? Giet je de data in een mooie visualisatie waarin iedereen zelf kan grasduinen door de informatie of schrijf je de conclusie volledig uit zodat iedereen het snapt? Volgens Jelle Kamsma, de eerste full-time datajournalist van Nu, was het lastig om dat zelf uit te vinden. Het gebrek aan modellen, stucturen en workflows vormde volgens hem een van de grootste barrires voor beginnende datajournalisten. Toen ik begon in dit werkgebied waren er geen lokale modellen beschikbaar. Ik had een mentor nodig, maar die was er niet in Nederland, dus ik moest ik alles zelf uitvinden. Nu zie je dat er steeds meer expertise wordt gedeeld en dat helpt.11 Een workflow is het stappenplan dat je volgt wanneer je aan een project werkt. Datajournalisten zijn er nog niet over uit welke aanpak het beste werkt. Een paar vaste onderdelen zijn al wel bekend: je moet de data verkrijgen, opschonen, analyseren en het resultaat - in wat voor vorm dan ook - publiceren. Maar hoe je dit proces goed aanpakt is nog
Peter Teffer, Nederland van Boven is de ijsbreker voor de datajournalistiek De Nieuwe Reporter (23-12-2011) http://www.denieuwereporter.nl/2011/12/nederland-van-boven-isde-ijsbreker-voor-de-datajournalistiek/ http://nederlandvanboven.vpro.nl/ 8 Paul Bradshaw, What is data journalism Data Journalism Handbook http://datajournalismhandbook.org/1.0/en/introduction_0.html 9 Paul Bradshaw, How to be a data journalist The Guardian http://www.guardian.co.uk/news/datablog/2010/oct/01/data-journalism-how-to-guide 10 Mirko Lorenz, Why journalists should use data Data Journalism Handbook (geen datum) http://datajournalismhandbook.org/1.0/en/introduction_1.html. 11 Liliana Bounegru, 'Digging deeper: An in-depth look at data journalism in the Netherlands' Data Driven Journalism (06-12-2011) datadrivenjournalism.net/news_and_analysis/doing_data_journalism_in_the_netherlands.
7

NERD MET VIJF POTEN

MASTERSCRIPTIE JAN KRUIDHOF

niet uitgekristalliseerd. Lucien Baard van De Twentse Courant Tubantia vergeleek het met het bakken van een cake: Datajournalistiek bestaat uit een aantal ingredinten. Wij hebben meel, eieren, melk, enzovoort. We gooien alles in een zak en schudden ermee, hopend dat er een cake uitkomt.12 Wat zou het mooi zijn als je een kijkje in de keuken van de Nederlandse datajournalisten zou kunnen nemen, dacht ik. Hoe zouden zij een datajournalistiek project aanpakken? En waar zitten de verschillen? Werkt een krant anders dan een blog? Is de convergentie van de journalistiek inmiddels al in zon vergevorderd stadium dat je dit terugziet in de aanpak van datajournalistieke projecten? Al deze vragen komen samen in een hoofdvraag: in hoeverre verschillen de workflows en routines van Nederlandse journalisten die zich bezighouden met datajournalistiek? Om deze vraag te beantwoorden ging ik in gesprek met deze journalisten, maar onderzocht ik ook wat in welke traditie de Nederlandse datajournalistiek voortborduurt en wat in het recente verleden al door wetenschappers over dit onderwerp geschreven is. In het onderzoek wordt allereerst het onderzoekssubject gepresenteerd. Er wordt besproken hoe datajournalistiek gedefinieerd zou kunnen worden en welke geschiedenis het metier heeft binnen en buiten onze landsgrenzen. Daarnaast wordt besproken welke actuele ontwikkelingen in Nederland plaatsvinden op dit gebied. Vervolgens wordt een overzicht gegeven van de onderzoeken die al eerder zijn gedaan naar de werkwijze van datajournalisten. Welke workflows zijn bekend en welke stappen zijn hierin te onderscheiden? Aansluitend wordt uiteengezet hoe dit onderzoek is uitgevoerd, hoe de respondenten zijn gekozen en genterviewd en welke methodes gehandhaafd zijn voor de analyse van de interviews. Hierna zullen de onderzoeksresultaten worden gepresenteerd. Tenslotte wordt de conclusie worden getrokken uit het onderzoek en de onderzoeksresultaten.

Jerry Vermanen, Vier lessen voor beginnende datajournalisten De Nieuwe Reporter (2902-2012) http://www.denieuwereporter.nl/2012/02/vier-lessen-voor-beginnenddatajournalisten/.

12

NERD MET VIJF POTEN

MASTERSCRIPTIE JAN KRUIDHOF

2. Theoretisch kader
Datajournalistiek is enerzijds een nieuwe ontwikkeling, maar kent anderzijds een lange traditie. In dit hoofdstuk zal worden uiteengezet hoe datajournalistiek opkwam en op welke journalistieke geschiedenis het voorborduurt. Maar wat is datajournalistiek nu exact? Over het antwoord op die vraag wordt nog flink gediscussieerd. De verschillende visies en standpunten in dit dispuut komen uitgebreid aan bod. Daarnaast zal worden beschreven hoe datajournalistiek zich momenteel in Nederland ontwikkelt. 2.1 Is een databestand journalistiek? Misschien denkt u wel: Laten we nu niet allemaal direct achter de zoveelste journalistieke rage aanrennen. Want data, is dat nu wel journalistiek? Het publiceren van ruwe data an sich, kun je dat echt onder de noemer journalistiek scharen? Adrian Holovaty, een jonge journalist en programmeur uit de Amerikaanse staat Illinois, was een van de eerste datajournalisten en hij werd een beetje zat van die vraag. In 2009 beantwoordde hij hem op zijn blog. Here, at last, is the definitive, two-part answer: 1. Who cares? 2. I hope my competitors waste their time arguing about this as long as possible.13 Holovaty won in 2005 op 24-jarige leeftijd de Knight Batten Award voor innovatieve journalistiek voor de site ChicagoCrime.org. Dit was een van de eerste zogenaamde mash-ups van data. Op de site werden misdaadcijfers van de politie van Chicago gecombineerd met de kaartgegevens van Google Maps. Inwoners van de stad konden na het invullen van eigen postcode bijvoorbeeld precies zien hoeveel moorden recentelijk in hun omgeving waren gepleegd en waar de meeste overvallen plaatsvonden.14 Inmiddels is de site opgegaan in EveryBlock, wat Holovaty zelf omschreef als chicagocrime.org on steroids, met meer dan alleen misdaadcijfers en informatie over verscheidene Amerikaanse steden.15

13

Adrian Holovaty, The definitive, two-part answer to "is data journalism?" Adrian Holovaty http://www.holovaty.com/writing/data-is-journalism/ (21-05-2009). 14 Pamela Licalzi O'Connell, Do-It-Yourself Cartography New York Times http://www.nytimes.com/2005/12/11/magazine/11ideas1-13.html?_r=1 (11-12-2005). 15 Adrian Holovaty, In memory of chicagocrime.org Adrian Holovaty http://www.holovaty.com/writing/chicagocrime.org-tribute/ (31-01-2008).

NERD MET VIJF POTEN

MASTERSCRIPTIE JAN KRUIDHOF

In 2006 schreef Holovaty een bericht op zijn blog wat naderhand werd omschreven als het manifest voor datajournalistiek.16 In zijn bericht riep Holovaty nieuwsorganisaties op afscheid te nemen van het wereldbeeld dat gefocust is op klassieke verhalen met een titel, intro en een lead. Wat hij dan wel wilde? Als voorbeeld noemde hij een verslag van een brand. Being able to read that story on a cell phone is fine and dandy. Hooray, technology! But what I really want to be able to do is explore the raw facts of that story, one by one, with layers of attribution, and an infrastructure for comparing the details of the fire.17 Hij zou willen dat hij de details van de brand datum, tijd, plaats, slachtoffers, brandweerkazerne, afstand tot de kazerne, namen en jaren werkervaring van betrokken brandweermannen, tijd die het kostte om te arriveren zou kunnen vergelijken met de details van eerdere branden. Dat is een goed voorbeeld van een datajournalistieke manier van denken. Holovaty vond het zelf niet belangrijk of wat hij voor ogen had journalistiek genoemd kon worden. [T]he question of How is this journalism? is academic, schreef hij. Journalisten zouden zich volgens hem minder druk moeten maken om wat wel en niet journalistiek is en meer om belangrijke, specifieke informatie waar mensen wat aan hebben in hun leven en die hun helpt om de wereld beter te begrijpen. A newspaper ought to be that: a fair look at current, important information for a readership.18 2.2 Wat is datajournalistiek? Adrian Holovaty was niet alleen degene die journalisten opriep om data en journalistiek te combineren, maar ook de eerste die dat beschreef als data journalism. Simon Rogers, eindredacteur van het datablog van The Guardian en een voorbeeld voor datajournalisten wereldwijd, schreef althans op Twitter: I first heard the words 'data journalism' from @adrianholovarty here in 2006. Started a journey for me.19 Nu was er dus een doel en een richting. Maar nog steeds was het niet gemakkelijk om datajournalistiek te omschrijven. Journalist en computerwetenschapper Jonathan Stray omschrijft datajournalistiek kortweg als obtaining, reporting on, curating and publishing data in the public interest.20 Het lastige van zon omschrijving is, dat er van alles onder kan vallen.
Adina Levin, Database journalism a different definition of news and reader BookBlog http://www.alevin.com/?p=1391 (23-03-2009). 17 Adrian Holovaty, A fundamental way newspaper sites need to change http://www.holovaty.com/writing/fundamental-change/ Adrian Holovaty (06-09-2006). 18 Ibidem. 19 Simon Rogers, @smfrogers Twitter (29-08-2011) https://twitter.com/smfrogers/status/108238296685096961. 20 Jonathan Stray, A computional journalism reading list Jonathan Stray http://jonathanstray.com/a-computational-journalism-reading-list (31-01-2011).
16

10

NERD MET VIJF POTEN

MASTERSCRIPTIE JAN KRUIDHOF

In its current state, data journalism describes neither a beat21 nor a particular medium, stelde Associated Press-redacteur Troy Thibodeaux.22 Datajournalistiek gaat immers niet alleen over financile of politieke onderwerpen. Het kan net zo goed gevaarlijke verkeerssituaties in een klein dorpje in kaart brengen als een overzicht bieden van de toestand van het onderwijs in een heel land. Verhalen die middels datajournalistiek tot stand komen kunnen gepubliceerd worden in kranten of op websites, maar ook in apps of televisieprogrammas. Bovendien omhelst het een overlappende set van uiteenlopende competenties uit verschillende werkvelden. Die combinatie van werkwijzes is volgens Thibodeaux vooral waar het in de datajournalistiek om gaat. De statistiekmethoden uit de sociale wetenschap, de technieken om kaarten te maken uit Geografische Informatie Systemen (GIS), de visualisaties van grafisch vormgevers en allerlei technieken enzovoort. Simon Rogers geeft, net als Adrian Holovaty, weinig om een specifieke definitie. In zijn artikel met de veelzeggende titel Anyone can do it - Datajournalism is the new punk stipt hij vooral aan wat datajournalistiek niet is. Zo gaat het volgens hem niet alleen om onderzoeksjournalistiek. Not all data journalism has to bring down the government - it's often enough for it to shine a light in corners that are less understood, to help us see the world a little clearer. Ook gaat het niet alleen om visualisaties. Data leent zich daar toevallig goed voor, maar terwijl sommige verhalen het beste tot hun recht komen in plaatjes en infographics, komen andere verhalen het beste tot hun recht in een geschreven tekst.23 Zelfs iets wat slordig uitgevoerd is kan toch raak zijn, stelt Rogers. Of course, for some people, this will never be journalism. But then, who cares? While they're worrying about the definitions, the rest of us can just get on with it.24 NRC Handelsblad-redacteur Dick van Eijk, die als een van de eerste Europese journalisten met datajournalistiek aan de slag ging, geeft wel om definities. In het jaarboek Onderzoeksjournalistiek 2012 van de Vereniging van Onderzoeksjournalisten (VVOJ) stelt hij allereerst dat het jammer is dat er zo weinig oog is voor de lange geschiedenis die datajournalistiek in Nederland heeft. In zijn slotalinea merkt hij op dat datavisualisatie toch
Een bepaald onderwerp dat je als journalist langdurig volgt en waar je regelmatig verslag van doet. 22 Troy Thibodeaux, 5 tips for getting started in data journalism Poynter (06-10-2011) http://www.poynter.org/how-tos/digital-strategies/147734/5-tips-for-getting-started-indata-journalism/. 23 Simon Rogers, Anyone can do it - Datajournalism is the new punk The Guardian Datablog (24-05-2012) http://www.guardian.co.uk/news/datablog/2012/may/24/datajournalism-punk 24 Ibidem.
21

van

computerwetenschappers:

database-administratie,

systeem-engineering

11

NERD MET VIJF POTEN

MASTERSCRIPTIE JAN KRUIDHOF

echt iets anders is dan datajournalistiek, hoewel het wel vaak op n hoop gegooid wordt. Een cruciaal aspect van journalistiek ontbreekt in datavisualisaties: het verhaal.25 Ook Nu-datajournalist Jerry Vermanen die zich overigens voornamelijk richt op datavisualisaties vindt ook dat iets wel aan bepaalde eisen moet voldoen voordat het datajournalistiek genoemd kan worden. RTL doet nog steeds aan datajournalistiek, volgens Andr Tak, schrijft hij op Twitter, verwijzend naar een artikel op De Nieuwe Reporter waarin de chef onderzoeksredactie van RTL Nieuws werd aangehaald.26 Dat klopt dus niet, reageert Vermanen.27 In een e-mail legt hij uit wat hij bedoelt: Het belangrijkste voor mij is dat RTL wel aan datajournalistiek doet, maar niet zo vaak als ze zelf denken. Volgens mij kun je het pas datajournalistiek noemen zodra je een goede analyse volgens een datajournalistiek proces erop hebt toegepast. En dat gebeurt niet altijd.28 Maar Vermanen kijkt ook direct kritisch naar zijn eigen werk. Daarbij kun je ook opmerken dat niet al mijn werk bij NU.nl datajournalistiek is. Een simpel grafiekje bij een werkeloosheidsbericht? Is dat datajournalistiek? Dat maakt mij niet zoveel uit, eigenlijk. Ik vind het belangrijker dat ls iets wordt voorgehouden als datajournalistiek, dat er ook daadwerkelijk een analyse op is toegepast waarin enkele basisprincipes van datajournalistiek terugkomen. Wat de basisprincipes van datajournalistiek zijn en wat het datajournalistiek proces behelst, komt in het volgende hoofdstuk aan bod. Kortom: er is nog geen vaste definitie te geven van het begrip datajournalistiek. Datajournalisten zijn het daar onderling nog niet over eens en maken zich ook lang niet allemaal druk om een precieze definitie zelfs niet als het om hun eigen werk gaat zoals ook uit de woorden van Vermanen blijkt. Toch moest voor dit onderzoek ergens een grens worden getrokken. Wat werd allemaal meegenomen in het onderzoek? Wat kan allemaal gezien worden als datajournalistiek? Aangezien er op dit moment geen vaste definitie van datajournalistiek valt te geven, is dit dilemma elementair benaderd. Datajournalistiek bestaat uit data en journalistiek. Wanneer in dit onderzoek wordt gesproken over datajournalistiek, gaat het om producties waarbij die twee elementen beiden een voorname rol spelen: de data en de journalistiek. Deze benadering levert direct een volgend dilemma op. Want wat zijn data? En wat is journalistiek? Alle gegevens vormen toch data? En staat het begrip journalistiek sinds de opkomst van bloggers en burgerjournalisten niet op losse schroeven? Om te beginnen met de
25

Dick van Eijk, Datajournalistiek in Nederland: hot, maar niet nieuw in: Ditty Eimers ed., Onderzoeksjournalistiek 2012 (Utrecht en Zellik, 2012) 67-70, aldaar 70. 26 Mirjam Prenger, Tegels lichten De Nieuwe Reporter (11-12-2012) http://www.denieuwereporter.nl/2012/12/tegels-lichten/. 27 Jerry Vermanen, @JerryVermanen Twitter (11-12-2012) https://twitter.com/jerryvermanen/status/278417298530918400. 28 Jerry Vermanen, correspondentie met auteur (15-01-2013).

12

NERD MET VIJF POTEN

MASTERSCRIPTIE JAN KRUIDHOF

data. In principe vormen alle gegevens inderdaad data. Wanneer in dit onderzoek wordt gesproken over data gaat het echter om kwantitatieve gegevens. Nu betekent dit niet direct dat datajournalistiek alleen om cijfertjes gaat. Getallen spelen vaak een rol, maar hoeven niet de boventoon te voeren. Ook een netwerkanalyse, waarbij gekeken wordt naar de relatie tussen verschillende actoren, kan gezien worden als datajournalistiek. Ook kan datajournalistiek gepresenteerd worden in de vorm van een kaart. In de uiteindelijke presentatie van zon netwerkanalyse of kaart hoeft de nadruk niet te liggen op cijfers, maar bij de totstandkoming van de analyse speelt kwantitatieve data wel een belangrijke rol. Nu zou in principe gesteld kunnen worden worden dat data an sich al datajournalistiek kunnen zijn, net zoals fotos an sich fotojournalistiek kunnen vormen. In dit onderzoek wordt met datajournalistiek echter geduid op journalistieke producties waarbij de data duidelijk ook zijn geanalyseerd en op een journalistieke wijze zijn gepresenteerd. Wat die analyse precies inhoudt komt in het volgende hoofdstuk aan bod. Maar wanneer wordt een productie met data precies journalistiek? Om die vraag te beantwoorden, moet eerst antwoord gegeven worden op de vraag: wat is journalistiek? Dick van Eijk schrijft in de inleiding van Investigative journalism in Europe dat er drie fundamenteel verschillende manieren zijn om deze vraag te beantwoorden: de empirische, de normatieve en de analytische manier. Bij de empirische manier wordt gekeken wat een journalist precies doet als hij zegt journalistiek bezig te zijn. Kortom: de alledaagse praktijk. Dit zijn vaak praktische criteria, die echter inconsistent of onlogisch kunnen zijn. Op de empirische wijze is het bijvoorbeeld moeilijk te zeggen of een datavisualisatie die zomaar door iemand online is gezet gezien kan worden als datajournalistiek. De normatieve manier geeft strikt gesproken geen antwoord op de vraag wat journalistiek is, maar beschrijft wat journalistiek zou moeten zijn. Dit is een belangrijk onderscheid. Een voorbeeld van een normatieve kenmerken zijn de negen principes die de Amerikaanse journalisten Tom Rosenstiel en Bill Kovach opstelden. Zij gingen aan het eind van de twintigste eeuw op zoek naar de basisprincipes van journalisten en destilleerden negen basiselementen, zoals: Journalisms first obligation is to the truth en Its essence is a discipline of verification.29 Wie leest en luistert
29

Bill Kovach en Tom Rosenstiel, The elements of journalism. What newspeople should know and the public should expect (New York 2001) 12; De volledige lijst van elementen is als volgt: 1. Journalisms first obligation is to the truth. 2. Its first loyalty is to citizens. 3. Its essence is a discipline of verification. 4. Its practitioners must maintain an independence from those they cover. 5. It must serve as an independent monitor of power. 6. It must provide a forum for public criticism and compromise. 7. It must strive to make the significant interesting and relevant.

13

NERD MET VIJF POTEN

MASTERSCRIPTIE JAN KRUIDHOF

hoe datajournalisten als Holovaty, Rogers en Vermanen over hun werk spreken, herkent dezelfde principes. De analytische manier tenslotte probeert journalistiek op zon manier te definieren dat de overeenkomsten en verschillen met aangrenzende disciplines als wetenschap en literatuur duidelijk worden.30 Hoogleraar Frank van Vree hanteert naast de normatieve en empirische definitie twee andere definities. Als derde noemt hij de sociologische of professionele definities, waarbij met journalistiek wordt geduid op een professionele gemeenschap met regels, beroepsorganisaties en beroepsopleidingen. Ten vierde noemt hij definities die gebaseerd zijn op de waarneming en het gedrag van de nieuwsconsument.31 Wanneer gesproken wordt over journalistiek, kan het dus gaan over het journalistieke ideaal, de praktijk of het beroep. Van Eijk komt uiteindelijk zelf tot de volgende definitie: Journalism is truth-seeking storytelling, primarily serving citizens, without a legal foundation.32 Dit is een definitie waar ik mij goed in kan vinden. Voldoet alles wat in dit onderzoek wordt aangeduid als datajournalistiek aan deze definitie van journalistiek? Nee. Er kan niet van elke besproken datajournalistieke productie worden gezegd dat die het resultaat is van een zoektocht naar waarheid. Soms zijn het gewoon leuke weetjes die aantrekkelijk worden gepresenteerd. Maar de besproken producties zijn wel afkomstig van journalistieke organisaties die over het algemeen streven naar truth-seeking storytelling waar met name burgers wat aan hebben. En de journalisten die aan het woord komen onderschrijven over het algemeen wel hetzelfde journalistieke ideaal en werken ook in dezelfde sector. Zijn dataproducties die niet journalistiek zijn daarom onbetrouwbaar en oninteressant? Nee, zeker niet. Er bestaan prachtige, betrouwbare datavisualisaties die niet journalistiek zijn. Maar die zijn eenvoudig niet het onderwerp van dit onderzoek. 2.3 Computer Assisted Reporting (CAR) Holovaty en Rogers komen wellicht wat eigenwijs over, met hun who cares-attitude. Maar ze beseffen zicht terdege dat zij niet het wiel hebben uitgevonden. In zijn e-book Facts are sacred The power of data stelt Rogers allereerst dat datajournalistiek wel trendy is, maar niet nieuw. Hij beschrijft hoe Florence Nightingale al tijdens de Krimoorlog (1853-1856) aantoonde dat je
8. It must keep the news comprehensive and proportional. 9. Its practitioners must be allowed to exercise their personal conscience. 30 Dick van Eijk, Introduction in: Dick van Eijk ed., Investigative Journalism in Europe (Amsterdam 2005) 4-6. 31 Frank van Free, in reactie op Dick van Eijk, Waarom een goede definitie van journalistiek belangrijk is De Nieuwe Reporter (07-07-2006) http://www.denieuwereporter.nl/2006/07/waarom-een-goede-definitie-van-journalistiekbelangrijk-is 32 Dick van Eijk, Introduction 8.

14

NERD MET VIJF POTEN

MASTERSCRIPTIE JAN KRUIDHOF

met cijfers, statistieken en visualisaties de maatschappij kunt veranderen.33 Ook besteed hij in het boek uitgebreid aandacht aan Philip Meyer, een van de eerste journalisten die computers gebruikte voor data-analyse. Na rellen in Detroit deed hij in 1967 samen met twee onderzoekers van de Universiteit van Michigan onderzoek met behulp van een computer, een IBM 360 ter grootte van een eettafel. In hun reportage voor de Detroit Free-Press toonden ze aan dat een willekeurige deelnemer aan de rellen net zo goed iemand met een universitaire opleiding kon zijn als een high school dropout. Het verslag zou later bekroond worden met een Pulitzerprijs en vormde volgens Meyer het begin van een nieuw tijdperk in de journalistiek. In zijn boek Precision Journalism, dat verscheen in 1973, legde Meyer uit hoe methoden uit de sociale wetenschap toegepast kunnen worden in de journalistieke praktijk. [P]ush journalism toward science, incorporating both the powerful data-gathering and analysis tools of science and its disciplined search for verifiable truth.34 Een jaar na het onderzoek van Meyer werd voor de eerste keer overheidsdata geanalyseerd met inzet van computers. Clarence Jones van de The Miami Herald liet in 1968 rechtenstudenten gegevens uit rechtbankdossiers invoeren in een computer. Uit analyse van de gegevens bleek dat sommige categorieeen verdacht vaker en zwaarder werden gestraft dan andere. Elliot Jaspin van The Providence Journal was de eerste journalist die overheidsbestanden aan elkaar koppelde. Zo kon hij vaststellen dat er veel schoolbuschauffeurs betrokken waren geweest bij verkeersovertredingen en drugshandel. De inzet van computers voor journalistiek kreeg de naam computer-assisted reporting, ofwel CAR.35 Er wordt ook wel gesproken van computerassisted research and reporting (CARR). Een andere benaming is computer-assisted journalism (CAJ). In dit onderzoeken blijft het beperkt tot CAR, aangezien dit de meestgebruikte term is. Deze term behelst een breed scala van activiteiten eigenlijk alles waarvoor je de computer kunt gebruiken bij nieuwsgaring. Dit loopt uiteen van zoeken op internet, e-mailen, maar ook dat wat wij nu beschouwen als datajournalistiek.36 In 1989 richtte de University of Missouri School of Journalism het Missouri Institute for Computer Assisted Reporting (MICAR) op, dat later werd omgedoopt tot National Institute for Computer Assisted Reporting (NICAR). Dit instituut werkte nauw samen met de onderzoeksjournalistieke organisatie Investigative Reporters en Editors (IRE). Zowel NICAR als
Simon Rogers, Facts are sacred - The power of data (2011). Philip Meyer, Precision journalism (1991). 35 Dick van Eijk en Henk van Ess, Lesmateriaal voor Computer Assisted Reporting (Amsterdam 2003) 10. 36 Steve Paulussen, journalistiek@internet.be. Een studie naar de mogelijkheden en gevolgen van het internet voor de journalistieke nieuwsgaring en nieuwsproductie (Gent 2003) 180.
34 33

15

NERD MET VIJF POTEN

MASTERSCRIPTIE JAN KRUIDHOF

IRE is altijd erg betrokken geweest bij de ontwikkeling van datajournalistiek en helpt journalisten met ondermeer congressen, trainingen en fondsen. 2.3.1 Verschil CAR en datajournalistiek Journalisten die data verzamelen, verwerken en analyseren zijn dus geen nieuw fenomeen. Maar wat is nu precies het verschil tussen datajournalistiek en CAR? CAR was and is primarily a technique, not a process affecting the whole workflow of journalism in a fundamental way, stelde de Duitse journalist Mirko Lorenz. Niet dat hij het belang van CAR wil afzwakken. This is not about devaluing CAR. The use of computer searches in large databases remains an extremely important skill for investigative journalism. But data-driven journalism is rather different, making CAR one element in the chain of future events. Today data-driven journalism can be defined as a workflow, where data is the basis for analysis, visualization and - most importantly storytelling.37 Voor de duidelijkheid: met data-driven journalism wordt hetzelfde aangeduid als met datajournalistiek. Ook Philip Meyer ziet een verschil tussen datajournalistiek en CAR: When information was scarce, most of our efforts were devoted to hunting and gathering. Now that information is abundant, processing is more important.38 Maar hoe ontwikkelde CAR zich in Nederland? Daarover gaat de volgende paragraaf. 2.4 Pioniers in Nederland Terwijl CAR in de Verenigde Staten een vlucht nam, gebeurde er in Europa nog vrij weinig. Een van de weinigen die zich op het nieuwe werkveld waagde was Dick van Eijk. De journalist van NRC Handelsblad herinnert zich de begindagen van CAR nog goed. In 1994 stuurde zijn krant hem naar een conferentie over datajournalistiek die NICAR en IRE jaarlijks organiseren. [Ik was] een van de circa 550 deelnemers, en een van de vijf Europeanen. De andere vier kwamen uit Scandinavi. Nederlandse journalisten behoorden volgens Van Eijk in Europa tot de pioniers op het gebied van datajournalistiek, ver voordat hun Britse collegas aan data begonnen te snuffelen. Sterker nog, sommigen hebben dat van hun Nederlandse collegas geleerd.39
37

Mirko Lorenz Status and Outlook for data-driven journalism in: Data-driven journalism: What is there to learn? A paper on the data-driven journalism roundtable held in Amsterdam on 24 August 2010. (2010) 9. http://mediapusher.eu/datadrivenjournalism/pdf/ddj_paper_final.pdf 38 Alex Howard, 'The bond between data and journalism grows stronger' O'Reilly (04-022012) http://radar.oreilly.com/2012/02/data-journalism-computer-assisted-reportinggovernment.html. 39 Dick van Eijk, Datajournalistiek in Nederland al twee decennia oud De Nieuwe Reporter (01-05-2012) http://www.denieuwereporter.nl/2012/05/datajournalistiek-in-nederland-altwee-decennia-oud/.

16

NERD MET VIJF POTEN

MASTERSCRIPTIE JAN KRUIDHOF

Van Eijk was sinds 1993 bezig met CAR, naast zijn andere werkzaamheden op de binnenlandredactie. Het eerste project ging over het onbekende netwerk van bestuurders in de sociale zekerheid.40 In 1994 werd een grote stap voorwaarts gemaakt. Na de gemeenteraadsverkiezingen bedacht de redactie dat het mogelijk moest zijn om de verkiezingsresultaten weer te geven op een kaart, waarbij de winsten of verliezen van een partij correspondeerden met een bepaalde kleur. Tegenwoordig is zoiets een fluitje van een cent, maar in 1994 was men hier in de verkiezingsnacht vier uur mee bezig. De verkiezingsuitslag had de redactie op een floppy gekregen van het Algemeen Nederlands Persbureau (ANP). Later kreeg de redactie ook medewerking van het het Centraal Bureau voor de Statistiek (CBS) en kon een kaart worden gemaakt met de geografische verdeling van scheidingen.41 De kaart van de verkiezingen werd gezien als een goede illustratie van de geografische aspecten van de politieke krachtmeting. Daarom werd dezelfde opzet toegepast na de Europese verkiezingen in 1994. Ook daarna bleef Van Eijk bezig met GIS-analyses. In december 1997 en januari 1998 verschenen in de bijlage Profiel en op de binnenlandpaginas van de NRC verhalen, kaarten, tabellen en cijfers over 2048 Nederlandse gemeenten. De verslagen werden gebundeld in het boek Een atlas van Nederlandse gemeenten.42 Dit was de eerste grote GIS-analyse van Nederland.43 Van Eijk gebruikte hiervoor databases met gegevens over de inkomensverdeling in die buurten. Dat leverde niet alleen mooie plaatjes op, maar ook interessante reportages over de bewoners van die buurten. Bovendien hadden de verhalen en kaarten ook een politieke impact, wordt gesteld in het handboek Onderzoeksjournalistiek, waar de werkwijze overigens wordt omschreven als datamining. In het algemeen was toen de indruk dat achterstandswijken vooral in gemeenten in het westen van het land zouden liggen. Maar de analyses en reportages in de atlas toonden aan dat ook bijvoorbeeld in het oosten veel buurten op achterstand stonden.44 Vanaf 2004 werd op de NRC-burelen opnieuw gewerkt aan een grootschalig dataproject. De redacteuren Freek Staps en Arlen Poort verzamelden samen met het data-analysebureau Dankers & Frank gegevens over de Nederlandse huizenmarkt door gewoon de informatie op te

Ibidem (DvE, DNR) Dick van Eijk, Computer Assisted Reporting in the Dutch Newsroom. The Case of NRC Handelsblad in Peter Vasterman en Peter Verwey red., Computer Assisted Research and Reporting (Utrecht 1994) 29-30. 42 Dick van Eijk, Een atlas van Nederlandse gemeenten. 2049 Buurten vergeleken (Rotterdam 1998). 43 Nico Kussendrager, Onderzoeksjournalistiek (Groningen 2007) 100. 44 Ibidem (NK, Ond.)
41

40

17

NERD MET VIJF POTEN

MASTERSCRIPTIE JAN KRUIDHOF

slaan die huizensite Funda publiceerde.45 Te koop: 90.000 huizen voor 28.000.000 euro, kopte NRC Handelsblad. Daaronder werd antwoord gegeven op vragen als: waar staan de duurste huizen, hoe lang staan ze te koop, waar staan de meeste huizen te koop?46 De daaropvolgende jaren bleef Dankers & Frank de gegevens van Funda verzamelen. Zodoende kon Poort in 2009 aan de hand van vijf jaar aan woningmarktgegevens een diepgravende publicatie over de invloed van de kredietcrisis op de Nederlandse woningmarkt brengen.47 In datzelfde jaar vertelde Poort in een interview met de VVOJ dat het downloaden van grote databases niet zo ingewikkeld is. Ik had inmiddels een cursus gevolgd in het downloaden van dit soort gegevens bij IRE. (...) Bij de IRE-cursus feitelijk drie workshops! had ik de programmeertaal Practical Extraction and Reporting Language ofwel Perl geleerd. Met Perl kun je een klein programma schrijven waarmee je gegevens binnenhaalt. Daarbij kun je aangeven in welke gegevens je genteresseerd bent. In mijn geval was dat bijvoorbeeld het adres en de prijs van de woning.48 Database onderzoek stond in Nederland en Vlaanderen nog in de kinderschoenen, stelde Poort in het interview. Hij pleitte ervoor dat journalisten daar meer mee bezig moeten, maar vermoedde dat er bij Nederlandse en Belgische journalisten te weinig kennis is over het doen van dit soort onderzoek. Jammer, want zo moeilijk is het niet. Het werk zelf misschien niet, als je een beetje om kunt gaan met computers, maar Poort noemde zelf ook een paar obstakels. Wanneer opleidingen niet voldoende mogelijkheden aanbieden om vaardig te worden in datajournalistiek, moet je zelf aan de slag. Zelf wat boeken kopen, naar wat cursussen gaan. Bovendien moet je je chef zien te overtuigen dat het zin heeft om je - deels - vrij te maken voor dit soort onderzoek. Kortom: Je moet zelf echt een doorzetter zijn om dit te doen.49 Bas Broekhuizen, docent Journalistiek en Nieuwe Media en voormalig internetredacteur bij de Volkskrant, riep journalisten in 2010 ook op om meer te experimenteren met het visualiseren van informatie.50 Arjan Dasselaar had twee jaar eerder al zijn teleurstelling geuit over het gebrek aan Nederlandse databasejournalistiek. Nederlandse journalistieke organisaties laten

Rachel Levy, Journalisten moeten meer database onderzoek doen Vereniging van Onderzoeksjournalisten (25-01-2009) http://www.vvoj.nl/cms/2009/01/25/journalistenmoeten-meer-database-onderzoek-doen/; N.B. Dit artikel is alleen te lezen voor leden van de VVOJ. 46 Kussendrager, Onderzoeksjournalistiek 100. 47 Levy, Journalisten moeten; Melle Garschagen, Arlen Poort, Er zit maar n ding op: omlaag. Verkopers wachten maandenlang met prijsverlaging NRC Handelsblad (17-012009) 14. 48 Levy, Journalisten moeten. 49 Ibidem. 50 Bas Broekhuizen, Journalisten moeten meer experimenteren met InfoVis De Nieuwe Reporter (03-02-2010) http://www.denieuwereporter.nl/2010/02/journalisten-moetenmeer-experimenteren-met-infovis/

45

18

NERD MET VIJF POTEN

MASTERSCRIPTIE JAN KRUIDHOF

databases met veelomvattende informatie [...] links liggen. Dick van Eijk stelde in dit artikel dat dit veel te maken heeft met de bedrijfscultuur van Nederlandse journalistieke organisaties. Een van de grote problemen bij het tot stand komen van databasejournalistiek is dat nieuwsredacties meestal niet de baas zijn over de technologie in een grote organisatie. Zelf experimenteren zit er daarom vaak niet in, omdat dit strijdig is met het IT-beleid.51 Een deel van de verklaring schuilt volgens Van Eijk ook in de doelstelling die journalistieke organisaties zich stellen: Journalistieke managers in Amerika hebben meer het idee dat hun medium ook service moet verlenen aan hun lezers. Behalve het geijkte nieuws horen daarbij ook databases.52 Maar het gebrek aan datajournalistiek is niet alleen de schuld van door hogerhand opgelegd IT-beleid of de servicegerichtheid van managers. Ook op redacties zelf mag er het nodige veranderd worden. Het is geen onwil van redacties, maar een gebrek aan kennis. In de Verenigde Staten zie je dat veel meer journalisten dan hier kunnen programmeren.53 2.5 Actueel overzicht datajournalistiek in Nederland Inmiddels wordt er in Nederland aardig aan de weg getimmerd op het gebied van datajournalistiek. Niet alleen in kranten, maar ook op internet, televisie en de radio komen datajournalistieke producties voorbij. In deze paragraaf wordt per medium een overzicht gegeven van de huidige ontwikkelingen. 2.5.1 Internet Begin 2011 ging Laurens Verhagen, de toenmalig hoofdredacteur van Nu, op zoek naar een datajournalist voor zijn nieuwssite. Op zijn verlanglijstje stond iemand die n enorme databases kon doorspitten, gegevens kon analyseren, combineren en eventueel visualiseren, n gewoon, ouderwets een verhaal kon schrijven n een teamspeler was. Misschien vroeg hij wel te veel, gaf Verhagen eerlijk toe.54 Maar hij vond toch een nerd met vijf poten en wel in de persoon van de toen pas afgestuurde Jelle Kamsma. Hij werd in het diepe gegooid en moest veel zelf uitvinden. Het eerste probleem dat ik tegenkwam is dat er geen mensen zijn die vaardig zijn in datajournalistiek en je dingen kunnen leren, aldus de datajournalist. Ik begon echt op nul en moest alles zelf uitvogelen. Een andere barriere is het gebrek aan modellen, structuren en
51

Arjan Dasselaar, Waar blijven de journalistieke databases? De Nieuwe Reporter (11-032008) http://www.denieuwereporter.nl/2008/03/waar-blijven-de-journalistieke-databases/. 52 Dasselaar, Waar blijven de journalistieke databases?. 53 Ibidem. 54 Joost Ramaer, 'Datajournalistiek, of: Nu zoekt nerd met vijf poten' De Nieuwe Reporter (24-01-2011) www.denieuwereporter.nl/2011/01/datajournalistiek-of-nu-nl-zoekt-nerdmet-vijf-poten/

19

NERD MET VIJF POTEN

MASTERSCRIPTIE JAN KRUIDHOF

workflows. Toen ik begon in dit veld waren er geen lokale modellen beschikbaar. Ik had een mentor nodig, maar die was er niet in Nederland, dus moest ik alles zelf uitvinden. Nu zie je dat er steeds meer expertise wordt gedeeld en dat helpt.55 In maart 2012 vertrok Kamsma naar RTL Nieuws, waarover later meer. Ook in de Nederlandse blogosfeer, het totaal van blogs en hun onderlinge verbanden, is men bezig met datajournalistiek. In 2011 kon het weblog Sargasso dankzij een startsubsidie van het Stimuleringsfonds voor de Pers 84.471 behalve een webredacteur ook een datajournalist aannemen. Het groepsblog wil hiermee de datajournalistiek in Nederland een impuls geven. Met datajournalistiek kan door het opsporen, verzamelen, analyseren en combineren van gegevens nieuwe informatie gegenereerd worden die anders niet beschikbaar zou zijn en die daarmee kan bijdragen aan de politieke meningsvorming.56 Sargasso werkt samen met het ANP, waarvoor het dagelijks een cijfernieuwtje aanlevert. De twee partijen organiseerden gezamenlijk een hackathon over armoede en in september staat een hackathon over de komende verkiezingen gepland.57 Bij een hackathon (een samenvoeging van hacken en marathon) biedt een nieuwsorganisatie meestal een dataset waar deelnemers mee aan de slag kunnen. De deelnemers hebben vaak erg uiteenlopende achtergronden. Vaak is het een combinatie van journalisten, ICTers, hackers en mensen die betrokken zijn bij het onderwerp door bijvoorbeeld hun beroep. De evenementen duren meestal 12 of 24 uur of zelfs meerdere dagen. Hackathons hebben twee primaire doelen. Allereerst kunnen nieuwsorganisaties zo een vliegende start geven aan hun datajournalistieke projecten. Daarnaast biedt het nieuwsorganisaties de kans om hun netwerk uit te breiden en talent aan te trekken. 2.5.2 Kranten Jelle Kamsma werd bij Nu opgevolgd door Jerry Vermanen, die tot die tijd bureauredacteur was bij het regionale dagblad De Stentor. Na het bezoeken van Hacking Journalism, een bijeenkomst voor journalisten en programmeurs rondom het thema datajournalistiek, kwam hij op idee voor RegioHack: een project van De Stentor, De Twentsche Courant Tubantia en Saxion
55

Liliana Bounegru, 'Digging deeper: An in-depth look at data journalism in the Netherlands' Data Driven Journalism (06-12-2011) datadrivenjournalism.net/news_and_analysis/doing_data_journalism_in_the_netherlands. 56 Dorien Vrieling, Sargasso Verlicht, Stimuleringsfonds voor de Pers (2011) http://www.persinnovatie.nl/3312/nl/Sargasso-verlicht. 57 Jerry Vermanen, Wat is er aan datajournalistiek in Nederland? De Nieuwe Reporter (2504-2012) http://www.denieuwereporter.nl/2012/04/wat-is-er-aan-datajournalistiek-innederland/; Dimitri Tokmetzis, Doe mee aan de Hackathon Verkiezingen 2012 Sargasso (25-06-2012) http://Sargasso.nl/archief/2012/06/25/doe-mee-met-de-hackathonverkiezingen-2012/.

20

NERD MET VIJF POTEN

MASTERSCRIPTIE JAN KRUIDHOF

Hogescholen waarbij journalisten samenwerken met programmeurs, opendata-experts en grafici om datajournalistiek in Nederland vooruit te helpen.58 In november 2011 organiseerde RegioHack een hackathon waar journalisten, studenten en programmeurs dertig uur lang onderzoek deden met behulp van data. De deelnemers liepen tegen veel muren op en kregen de nodige teleurstellingen te verwerken, maar kwamen ook veel te weten.59 Inmiddels zijn er alweer plannen gesmeed voor de tweede versie van RegioHack en voorafgaande open avonden.60 Ook de Volkskrant heeft een datajournalist in huis. Sybren Kooistra, een voormalig stagiair, ging hier in september 2012 aan de slag.61 NRC Handelsblad, de eerste krant die zich in Nederland intensief bezighield met datajournalistiek, bleef zich op dit gebied verder ontwikkelen. Begin 2012 presenteerde Arlen Poort bijvoorbeeld met behulp van cijfers van het CBS een uiterst gedetailleerde kaart waar bezoekers konden inzoomen op ieder postcodegebied om te kijken hoe het daar gesteld was met onder meer het fiscaal maandinkomen per persoon of het percentage niet-westerse allochtonen of eenouderhuishoudens.62 2.5.3 Radio en televisie In Hilversum was de VPRO de eerste omroep die een datajournalist in dienst nam. Frdrik Ruys ging aan de slag voor Nederland van Boven, wat - zoals beschreven in de inleiding - een groot succes was. De collegas van het documentaireprogramma Tegenlicht ontwikkelden in 2011 de eerste iPad-documentaire ter wereld bij de aflevering Money & Speed: Inside the black box. Deze documentaire draait om de flash crash die op 6 mei 2010 plaatsvond op de Amerikaanse financile markten. Aan de hand van interviews met experts en minitieuze datavisualisaties en kaarten is geprobeerd de snelste en diepste daling van de Dow Jones tot dan toe te reconstrueren.63 Het VPRO-radioprogramma Argos droeg een steentje bij door, in samenwerking met studenten van de Radbout Universiteit Nijmegen, een verbeterde Wikileaks-zoekmachine te
58

Jerry Vermanen, Femke Nales, Martijn Bekhuis en Heinze Havinga 'Voorstelrondje: wie zitten er achter RegioHack?' RegioHack (13-09-2011) www.regiohacknl/regiohackblog/voorstelrondje-wie-zitten-er-achter-regiohack. 59 Jerry Vermanen, 'RegioHack, the day after' RegioHack (12-11-2011) www.regiohack.nl/regiohack-blog/regiohack-the-day-after/. 60 Heinze Havinga, @HeinzeHavinga Twitter (26-07-2012) https://twitter.com/HeinzeHavinga/status/228588255887642624 . 61 http://nl.linkedin.com/in/sybrenkooistra; E-mailcorrespondentie tussen auteur en Sybren Kooistra. 62 Arlen Poort, Statistiek saai? CBS-cijfers komen tot leven op de kaart NRC (14-02-2012) www.nrc.nl/nieuws/2012/02/14/statistiek-saai-cbs-cijfers-komen-tot-leven-op-een-kaart. 63 Money & speed: Inside the black box Tegenlicht (31-01-2011) http://tegenlicht.vpro.nl/afleveringen/2010-2011/the-future-of-finance/money-andspeed.html.

21

NERD MET VIJF POTEN

MASTERSCRIPTIE JAN KRUIDHOF

ontwikkelen.64 Met The Argos Machinery kunnen zowel de cables als de war logs van Irak en Afghanistan doorzocht worden. Wat in het kader van open data wel opmerkelijk is, is dat de zoekmachine niet publiek toegankelijk is gemaakt. Alleen collegas, journalisten en onderzoekers hebben toegang tot de machine en pas nadat zij hun gerichte vragen hebben voorgelegd. [D]aar hebben we een simpele reden voor, vertelde Argos-redacteur Huub Jaspers. Wij kunnen werken met de meest ongecensureerde documenten. We hebben deze week gemerkt dat er ook in de gecensureerde versie van de documenten veel persoonsgegevens staan, bijvoorbeeld over personen die samen werken met de Amerikanen in landen waar er partijen zijn die dat die mensen heel erg kwalijk kunnen nemen. Wij vinden toch dat je dat toch niet zomaar toegankelijk moet kunnen maken voor mensen.65 Ook het NCRV-televisieprogramma Altijd Wat heeft een datajournalist in dienst genomen. Erik Bloem maakte in april 2012 de overstap van de Volkskrant naar het opinierende programma.66 De aanstelling van Jelle Kamsma bij RTL Nieuws was van korte duur. Na drie maanden besloot RTL niet verder te willen met de datajournalist. Hun datajournalistieke project - RTL Nieuws Facts, waarvoor in 2011 92.500 beschikbaar werd gesteld door het Stimuleringsfonds voor de Pers - gaat wel door. Nieuws Facts zou een platform voor data- en onderzoeksjournalistiek moeten worden.67 De site werd in februari 2013 gelanceerd. De NOS heeft op dit moment geen datajournalist in dienst, maar is wel met het onderwerp bezig. De nadruk ligt hier vooral op het visualiseren van data. Ik vind dat we daarin voorop moeten lopen, vertelde informatiespecialist Anke Vellenga. Saaie tabellen leest niemand.68 Samen met collegas van andere afdelingen vormde ze daarom een werkgroep voor

VVOJ-voorzitter Henk van Ess ontwikkelde eerder al de Wikileaks-zoekmachine Cablesearch, in samenwerking met een programmeur die op de site alleen wordt aangeduid als Udo; Tonie van Ringelestijn, 'Nederlander maakt betere Wikileaks-zoeker' Bright (0212-2010) https://www.bright.nl/nederlander-maakt-betere-wikileaks-zoeker; http://cablesearch.org/?page_id=61. 65 Samir Streefkerk, 'Argos komt met nieuwe Wikileaks-zoekmachine: 'Media moeten nieuwe wegen bewandelen'' OnJo (13-10-2011) www.onjo.nl/Item.2569.0.html?&no_cache=1&tx_ttnews%5Btt_news%5D=51046 66 http://www.linkedin.com/in/erikbloemjournalist 67 Jaap Meijers, 'RTL Nieuws gaat verder met datajournalistiek - znder datajournalist' De Nieuwe Reporter (05-06-2012) www.denieuwereporter.nl/2012/06/rtl-nieuws-gaat-verdermet-datajournalistiek-zonder-datajournalist; RTL Nieuws Facts Stimuleringsfonds voor de Pers http://www.persinnovatie.nl/3309/nl/rtl-nieuws-facts 68 Bas Nieuwenhuijsen, Datavisualisatie is een andere, leuke manier om je verhaal te vertellen Spreekbuis (geen datum) http://www.spreekbuis.nl/content/2600/%22Datavisualisatie_is_een_andere__leuke_manie r_om_je_verhaal_te_vertellen%22.html.

64

22

NERD MET VIJF POTEN

MASTERSCRIPTIE JAN KRUIDHOF

datavisualisatie.69 Een van de leden van de werkgroep is onderzoeksjournalist Hugo van der Parre. Het is een zoektocht. Hoe maak je een onderwerp zo helder mogelijk? Welke tools hebben we, welke moeten worden aangepast of nieuw ontwikkeld?70 Volgens Vellenga zal in de toekomst iedere NOS-journalist om moeten kunnen gaan met datavisualisaties. Het is voor ons een taak erbij, wij maken bijvoorbeeld tijdlijnen. Uiteindelijk moeten anderen binnen de NOS dat ook kunnen doen, het moet een normaal onderdeel van het werk worden.71 Datajournalistiek bouwt voort op het fundament dat is gelegd met CAR en precision journalism. Deze journalistieke werkwijzen kwamen op in de Verenigde Staten en werden later ook in Europa opgepikt. Behalve de essentie het gebruiken van data in journalistieke producties is ook de workflow van precision journalism doorgesijpeld in de datajournalistiek van vandaag. Hierover gaat het volgende hoofdstuk, waarin verschillende workflows worden vergeleken.

Anke Vellenga, Datajournalistiek en visualisatie nieuwe uitdaging voor informatiespecialisten Vereniging van Pers- en Omroepdocumentalisten (09-01-2012) http://www.vpod.nl/datajournalistiek-en-visualisatie-nieuwe-uitdaging-voorinformatiespecialisten/. 70 Ibidem. 71 Ibidem.

69

23

NERD MET VIJF POTEN

MASTERSCRIPTIE JAN KRUIDHOF

3. Workflows en routines
Verschillende journalisten en onderzoekers noemden het ontbreken van een workflow een obstakel in de datajournalistiek. Er bestaan inmiddels wel een aantal beschrijvingen van de processen die voorkomen bij de totstandkoming van een datajournalistieke productie. Geven deze modellen het proces allemaal op dezelfde manier weer of zijn er verschillen? 3.1 Basiselementen van journalistieke workflow Philip Meyer gaf in Precision journalism al aan dat the journalistic body of knowledge sowieso de volgende elementen moet bevatten: 1. How to find information; 2. How to evaluate and analyze it; 3. How to communicate it in a way that will pierce the babble of information overload and reach the people who need and want it. 72 Dit zijn de basiskwaliteiten waarover iedere goede journalist volgens Meyer moet beschikken. Dit lijkt op het eerste oog redelijk vanzelfsprekend, maar Meyer benadrukt dat dit ook betekent dat je allerlei dingen niet moet doen. Stap 1, informatie vinden, lijkt bijvoorbeeld nogal evident. Maar het houdt ook in, dat je als journalist niet alles gelooft wat je verteld wordt, niet gemakkelijk te manipuleren bent en niet teveel vertrouwt op persberichten. Dit is ook erg belangrijk om in gedachten te houden bij datajournalistiek, want ook datasets zijn makkelijk te manipuleren. En heb je eenmaal betrouwbare en interessante informatie gevonden, dan kun je die niet zomaar de wereld insturen. Eerst komt stap 2: evalueren en analyseren. Kijk welk verhaal er achter jouw informatie schuilgaat. Is wat je ziet logisch? Kun je een patroon te herkennen? Bestaat er een opvallende afwijking? Is er informatie die verdere vragen oproept? Kun je de informatie vergelijken met soortgelijke gevallen? Wanneer je op deze manier de kern van je verhaal hebt gevonden, is het tijd voor stap 3: het presenteren van je verhaal. Doe dit zo effectief mogelijk. Het kan verleidelijk zijn om je publiek te imponeren met een overdaad aan bronnen en verhalen. Een overdaad aan informatie leidt tot ruis. Een journalistiek verhaal moet helder en duidelijk zijn om zijn publiek te bereiken.

72

Philip Meyer, Precision journalism.

24

NERD MET VIJF POTEN

MASTERSCRIPTIE JAN KRUIDHOF

In principe is dit ook de essentie van de huidige workflowmodellen voor datajournalistieke producties: informatie vinden, analyseren en presenteren. Maar dan moet je wel weten wat je met data kunt doen. Knowing what to do with data is volgens Meyer de essentie van the new precision journalism. Hij helpt zijn lezers vooruit met een stappenplan. Het mooie van deze workflow uit 1991 is, dat je hier enerzijds duidelijk kenmerken uit de tijd van precision journalism en CAR terugziet, maar anderzijds ook de contouren herkent van de huidige workflowmodellen. Die elementen uit de tijd van CAR kunnen ietwat gedateerd lijken, net zoals de logge IBM 360 waarmee Meyer zijn onderzoek uitvoerde in onze ogen een antieke computer lijkt. Maar die computer bevatte wel belangrijke elementen waarop onze computers van vandaag voortborduren en zodoende is ook de verouderde workflow van Meyer een interessant uitgangspunt voor een vergelijking van de workflowmodellen van vandaag. Meyer beschrijft als volgt hoe je te werk moet gaan met data. 1. Collect it. Deze stap lijkt vanzelfsprekend, maar zeker toen in 1973 de eerste editie van Precision Journalism verscheen, was het nog helemaal niet gebruikelijk om iets wetenschappelijks als datasets te gebruiken voor journalistiek. Maar je moet er wel wat voor doen, data komt niet vanzelf naar jou toe. 2. Store it. Old-time journalists store data on stacks of paper on their desks, in corners of their offices, and, if they are really well organized, in clip-files, stelt Meyer. Computers are better. Dit is nu typisch een opmerking uit het CAR-tijdperk, waarin lezers nog op de handige eigenschappen van een computer gewezen moesten worden. Niettemin is dit vandaag ook nog een issue: een prachtige tabel kan waardeloos zijn als je het als printje aangeleverd krijgt en niet in een computer kan analyseren. 3. Retrieve it. Met de gereedschapset van precisiejournalistiek kun je informatie aan een dataset onttrekken die er niet bewust in is gestopt. Je moet alleen wel de juiste vragen op de juiste manier weten te stellen. 4. Analyze it. Journalistic analysis often consists of merely sorting to find and list the interesting

25

NERD MET VIJF POTEN

MASTERSCRIPTIE JAN KRUIDHOF

deviances. Behalve het noteren van interessante afwijkingen kan analyseren ook bestaan uit het traceren van patronen die wellicht iets suggereren. 5. Reduce it. Data reduceren is net zo belangrijk als data verzamelen. A good news story is defined by what it leaves out as well as what it includes. Dit zien we ook terug in de opvattingen van de huidige Nederlandse datajournalisten. 6. Communicate it. Publiceer je verhaal, maar houd het begrijpelijk en leesbaar. A report unread or not understood is a report wasted.73

3.2 The inverted pyramid of data journalism Een van de bekendste modellen is opgesteld door de Britse internetjournalist Paul Bradshaw. Behalve journalist is Bradshaw ook auteur van het Online Journalism Handbook en doceert interjournalistiek aan de Birmingham City University en City University's School of Journalism in London. Hij schreef mee aan verschillende boeken over journalistiek en is oprichter van de crowdsourcing-website Help me investigate. In oktober 2010 beschreef Bradshaw in het artikel How to be a data journalist waaruit het werk van een datajournalist bestaat.74 Dit model, dat hij later The Data Journalism Continuum zou noemen, bestond uit vier achtereenvolgende stappen: finding, interrogating, visualising en mashing.75 In juli 2011 publiceerde Bradshaw een herziende versie van het model: the inverted pyramid of data journalism.76

73 74

Philip Meyer, Precision journalism. Paul Bradshaw, How to be a data journalist The Guardian (01-10-2010) http://www.guardian.co.uk/news/datablog/2010/oct/01/data-journalism-how-to-guide 75 Paul Bradshaw, Data journalism (22-02-2011) slide 23/48 http://www.slideshare.net/onlinejournalist/data-journalism-city-online-journalism-wk8 76 Paul Bradshaw, The inverted pyramid of data journalism http://onlinejournalismblog.com/2011/07/07/the-inverted-pyramid-of-data-journalism/

26

NERD MET VIJF POTEN

MASTERSCRIPTIE JAN KRUIDHOF

Figuur 1: The inverted pyramid of data journalism Zoals te zien is de pyramide opgebouwd uit vijf lagen: compile (samenstellen), clean (opschonen), context, (combine) combineren. De laatste stap is communicate (overbrengen). Deze laag is door Bradshaw ook weer in zes delen opgesplitst. In de presentatie van zijn model, op het Online Journalism Blog, gaf hij de volgende toelichting bij de stappen. Dit is volgens mij de meeste heldere beschrijving van de verschillende stadia in het totstandkomingsproces van een datajournalistiek item. 3.2.1 Samenstellen Het samenstellen is volgens Bradshaw het belangrijkste stadium. Niet alleen omdat al het andere daarop rust, maar omdat dit het stadium is waar het meest op teruggekeerd wordt. In ieder volgend stadium kan het nodig zijn nieuwe informatie samen te stellen. Het samenstellen is dus niet een stap die altijd na het verkrijgen van de eerste data is afgerond. Soms kan het nodig zijn om later nog nieuwe data te verzamelen. Je zou het kunnen vergelijken met een kleisculptuur: soms heb je genoeg aan de eerste homp klei waarmee je begint en soms moet je daar later nog wat klei aan toevoegen. En af en toe leg je in eerste instantie een stukje opzij wat later toch goed van pas komt. Het samenstellen zelf kan verschillende vormen aannemen. Data wordt, in het meest eenvoudige geval: 1. direct geleverd door een organisatie

27

NERD MET VIJF POTEN

MASTERSCRIPTIE JAN KRUIDHOF

2. gevonden door geavanceerde zoekmethoden om de krochten van overheidswebsites te doorzoeken 3. samengesteld middels het scrapen van databases achter online formulieren of paginas 4. verkregen door documenten om te zetten in een bestand dat kan worden geanalyseerd 5. verkregen door informatie uit APIs te halen 6. door de journalist zelf verzameld worden door observaties, online formulieren of crowdsourcing 3.2.2 Opschonen Data verkrijgen is slechts het begin. Je moet ook kunnen vertrouwen op de kwaliteit van de data. Dit betekent dat je het moet opschonen. Dit opschonen neemt doorgaans twee vormen aan: het verwijderen van menselijke fouten en het converteren van de data naar een bestand dat overeenkomt met de andere data die je gebruikt. Wat bijvoorbeeld vaak voorkomt in datasets zijn: dubbele entries, lege entries, verkeerde vorm informatie (bijvoorbeeld woorden in plaats van nummers) en verschillende namen voor hetzelfde (P.v.d.A. of PvdA). 3.2.3 Contextualiseren Net als andere bronnen is data niet altijd betrouwbaar. Het draagt zijn eigen bias, verhaal en standpunt met zich mee. Net als bij andere bronnen moet je je afvragen wie de data verzameld heeft, wanneer, hoe en met welk doel. Waarschijnlijk moet je na het beantwoorden van die vragen op zoek naar nog meer data. Neem het aantal misdaden in een stad: dat is interessant om te weten, maar pas als je de context weet. Hoeveel mensen wonen er in een stad, hoeveel politie is er, hoeveel misdaden werden er vijf jaar eerder gepleegd, wat is de definitie van misdaad, hoeveel mensen zijn er werkloos. Kennis van statistiek is wat dit betreft een must. Overigens: wanneer je aan het begin van het proces een duidelijke vraag hebt, helpt dat om je focus niet te verliezen of een interessante invalshoek te missen. 3.2.4. Combineren Goede verhalen knnen gevonden worden in een enkele dataset, maar vaak zul je twee sets moeten combineren. Immers, als je mocht kiezen tussen een verhaal met n bron of een met meerdere bronnen, wat zou je dan kiezen? De klassieke combinatie is de mashup op een kaart: combineer je data met geografische gegevens en visualiseer zo de regionale verspreiding van een verschijnsel. Waar komen de bezuinigingen het hardste aan? Welke scholen doen het het beste? Wat zijn wereldwijd de meest besproken onderwerpen op Twitter?

28

NERD MET VIJF POTEN

MASTERSCRIPTIE JAN KRUIDHOF

3.3 De workflow van The Guardian Paul Bradshaw is niet de enige die de algemene workflow van datajournalistiek in kaart heeft gebracht. Simon Rogers, eindredacteur van de dataredactie van The Guardian, heeft bijvoorbeeld in een grafiek weergegeven hoe zijn redactie normaal gesproken een datajournalistiek project aanpakt. Een beetje dubbelop misschien, grapte hij zelf. Yes, this is a graphic about how we produce data that often results in graphics. A data visualisation about data visualisations, if you will. Hij lichtte de grafiek kort toe op het Datablog.77 Stap n is het lokaliseren van de data. Net als Bradshaw gaf ook Rogers aan dat die data uit allerlei bronnen afkomstig kunnen zijn: actueel nieuws, overheidsdata, journalistieke research enzovoort. Stap twee is kijken wat er met de data gedaan kan worden. Moeten die gecombineerd worden met andere datasets (mash it up)? Hoe kunnen ontwikkelingen het beste worden weergegeven? Stap drie is het opschonen van de data. Rogers beschrijft dit bijna hetzelfde als Bradshaw. Stap vier: Now were getting there. Nu is het tijd om daadwerkelijk berekeningen uit te voeren om te kijken of er een verhaal in de data zit. De laatste stap is stap vijf: het kiezen van een output. Wat is de beste vorm om het verhaal te presenteren: een tekst, een grafiek, een visualisatie? Welke tools gebruiken we daarvoor?

Simon Rogers, Data journalism broken down: what we do to the data before you see it The Guardian (07-04-2011) http://www.guardian.co.uk/news/datablog/2011/apr/07/datajournalism-workflow.

77

29

NERD MET VIJF POTEN

MASTERSCRIPTIE JAN KRUIDHOF

Figuur 2: Guardian data journalism workflow

30

NERD MET VIJF POTEN

MASTERSCRIPTIE JAN KRUIDHOF

3.4 Workflows wereldwijd Simon Rogers werkte ook mee aan het onderzoek Trends in Data Journalism, dat in september 2011 verscheen. Het werd geschreven door de Finse onderzoekers Tanja Aitamurto, Esa Sirkkunen en Pauliina Lehtonen. Aitamurto interviewde Rogers en acht andere datajournalisten uit het Verenigd Koninkrijk, de Verenigde Staten en Argentini en vroeg hen onder meer naar hun workflow bij bij datajournalistieke onderwerpen. De onderzoekers concludeerden dat er twee manieren zijn om een datajournalitiek verhaal te beginnen. Optie 1 is dat de redactie al een verhaal heeft ontdekt en dat de dataset meer informatie verschaft over dat onderwerp. Optie 2 is dat een dataset dient als startpunt voor het hele verhaal. De eerste optie lijkt volgens de onderzoekers meer gangbaar bij de nieuwsorganisaties die zij onderzochten.78 Ook Aitamurto en zijn collegas volgen min of meer dezelfde volgorde als Bradshaw en Rogers. Na het verkrijgen van de data gaat het datateam de data eerst opschonen, om die vervolgens te analyseren. Indien nodig worden de data gecombineerd met andere datasets om zo weer nieuwe datasets te creren. Na de analyse worden visualisaties en graphics gemaakt door het team zelf of in samenwerking met andere afdelingen. Nieuwsorganisaties benadrukken hierbij de verhaallijn. [D]ata visualisations and analyses are often a part of story, embedded in the storyline, rather than the storys main point.79 The data-analysis process can result in stories with visualisations, or in more permanent news applications on the Web [] Further, news organisations are looking into the possibility of developing mobile applications, as well, but the emphasis is still heavily on the Web.80 De gebruikte datasets worden normaal gesproken ook op de websites van de nieuwsorganisaties gepubliceerd. Het publiceren van de ruwe data wordt gezien als een integraal onderdeel van het

Tanja Aitamurto, Esa Sirkkunen en Pauliina Lehtonen, Trends In Data Journalism (08-092011) 11 http://virtual.vtt.fi/virtual/nextmedia/Deliverables2011/D3.2.1.2.B_Hyperlocal_Trends_In%20Data_Journalism.pdf; Geinterviewde journalisten: 1. Simon Rogers, The Guardian, editor of The Guardian.co.uk/data, United Kingdom. 2. David Donald, data editor, iWatch News, Center for Public Integrity, United States. 3. Scott Klein, Pro Publica, editor of news application, United States. 4. Barbara Grady, Oakland Local, United States. 5. Shane Shafflet, Bay Citizen, software developer and reporter, United States. 6. Jeffrey Friedman, research director, Maplight, United States. 7. Angelica Peralta, La Nacion, editor of news applications, Argentina. 8. Joseph Germuska, The Chicago Tribune, senior developer, news applications, United States. 9. Peter Aldhous, The New Scientist 79 Ibidem. 80 Ibidem.

78

31

NERD MET VIJF POTEN

MASTERSCRIPTIE JAN KRUIDHOF

[story] proces. Dit heeft twee redenen: allereerst, transparantie. Wanneer de datasets online staan kan iedereen er dezelfde analyses mee doen en de resultaten vergelijken met die van de nieuwsorganisatie. Ten tweede kunnen nieuwsorganisaties door het publiceren van de data mensen uitnodigen om zelf aan de slag te gaan met de data en nieuwe informatie te creren. Zo kan de samenleving meer profiteren van het simpelweg publiceren van datasets dan van het publiceren van slechts de nieuwsreportage. Anderen kunnen relevante informatie vinden die niet opgemerkt was door de journalisten. Aitamurto en zijn collegas stellen concluderend dat de workflow ruwweg in de volgende stappen valt op te delen: 1. Het herkennen van de kern van het verhaal en de mogelijke rol voor de data in het verhaal 2. Het herkennen en verkrijgen van de benodigde juiste data 3. Het geschikt maken van de data voor analyse 4. Analyse van de gegevens met de juiste tools en zonodig het mashen met andere datasets 5. De productie van het verhaal: tekst, visualisaties, interactieve elementen. 6. Het publiceren van de gegevens die werden gebruikt in de analyse. 7. Lezers uitnodigen om zelf aan de slag te gaan met de data, erop te reageren of het verhaal te delen met social media als Flickr, Facebook en Twitter.81 3.5 Mirko Lorenz Mirko Lorenz: Data-driven journalism can be defined as a workflow, where data is the basis for analysis, visualization and - most importantly storytelling.82 Datajournalistiek kent niet alleen een workflow, zoals alle journalistiek. Nee, datajournalistiek s een workflow. Althans, dat stelde Mirko Lorenz in zijn artikel Status and outlook for datadriven journalism. In 2010 heeft hij deze definitie in een paar stappen uiteengezet op IJ-7, een

Tanja Aitamurto e.a., Trends In Data Journalism 11. Mirko Lorenz, Status and Outlook for data-driven journalism in: Data-driven journalism: What is there to learn? A paper on the data-driven journalism roundtable held in Amsterdam on 24 August 2010 http://mediapusher.eu/datadrivenjournalism/pdf/ddj_paper_final.pdf (2010) 10.
82

81

32

NERD MET VIJF POTEN

MASTERSCRIPTIE JAN KRUIDHOF

conferentie over onderzoeksjournalistiek van de universiteit van Stanford.83 Waar het Finse onderzoek eindigde met zeven stappen, beperkt Lorenz zich tot vijf stadia. 1. Digging deep into (big) data (scrape, cleanse, structure) 2. Mining for "nuggets" of information (filter) 3. Visualizing information in graphics or multimedia specials 4. Connecting classic storytelling with otherwise dry statistics 5. Creating media that has value for readers/users 3.6 Nederland van Boven Frederik Ruys visualiseerde voor het VPRO-programma Nederland van Boven allerlei datasets. Voor het journalistieke vaktijdschrift Villamedia visualiseerde de datajournalist zijn eigen manier van werken.84

Figuur 3: Workflow Nederland van Boven Ook hier is een inmiddels herkenbare volgorde zichtbaar. Wat op televisie natuurlijk wel belangrijker is dan voor kranten en weblogs is de laatste stap: het animeren. Want alleen een statische visualisatie is natuurlijk niet voldoende voor een televisieprogramma.

http://www.slideshare.net/mirkolorenz/datadriven-journalism-what-is-there-to-learn (Sheet 8/33) 84 De illustratie is gemaakt door Frederik Ruys en verscheen bij het artikel: Dolf Rogmans, 'Cijfers brengen de mierenhoop tot leven' Villamedia (21-10-2011).

83

33

NERD MET VIJF POTEN

MASTERSCRIPTIE JAN KRUIDHOF

3.7 Luuk Sengers In Nederland heeft onderzoeksjournalist en docent journalistiek Luuk Sengers gedetailleerd beschreven welke workflow je bij dataprojecten zou kunnen volgen. In zijn boek Onderzoeksjournalistiek: researchproces van idee tot verhaal geeft hij niet zozeer een beschrijving van geanalyseerde workflows, maar adviseert hij een zekere workflow door een bepaalde volgorde van vragen uit te stippelen die een beginnend datajournalist voor zichzelf zou moeten beantwoorden. Het allereerste wat je jezelf zou moeten afvragen is volgens Sengers: Welke data zijn er over mijn onderwerp en wie verzamelt die? Hij geeft een aantal hulpvragen die je jezelf zou kunnen stellen om erachter te komen welke data je nodig hebt. Welke daders, getroffenen en/of getuigen houden misschien gestructureerd gegevens bij? Wie heeft er belang bij om bepaalde zaken te registreren of te meten? En wie heeft er een plicht om gegevens bij te houden? Moeten zij die data doorgeven aan een autoriteit, bijvoorbeeld de overheid, een statistisch bureau of een overkoepelende (belangen-) organisatie? Sengers hanteert in zijn volgorde van vragen dezelfde volgorde van themas die eerder al in bovenstaande workflows te zien waren. Stap twee is: Hoe krijg ik data die niet online staan? Stap drie is het organiseren van data en stap vier en vijf gaan over het presenteren van de data, respectievelijk in een geografische kaart en een netwerkvisualisatie. 3.8 Waar te beginnen? De workflowmodellen komen in grove lijnen aardig overeen. Ieder model kent (een vergelijkbare vorm van) de volgende volgorde van stappen: - het verkrijgen van data - het opschonen van data - het analyseren van data - het presenteren van het verhaal dat uit de data naar voren komt In de praktijk kan de invulling van die workflow wel verschillen. Voordat de Nederlandse datajournalisten naar hun werkwijze werd gevraagd, is voor dit onderzoek eerst uitgezocht welke verschillende werkwijzen al gedocumenteerd zijn.

34

NERD MET VIJF POTEN

MASTERSCRIPTIE JAN KRUIDHOF

De verschillen beginnen al bij het allereerste begin: waar begin je mee? Een mogelijkheid is om te beginnen met de data. Zoek een interessante dataset, bekijk het van alle kanten en zoek naar een interessante journalistieke invalshoek. Maar volgens Carin Beenen, journalist bij het Eindhovens Dagblad, is het beter om allereerst een goede en journalistieke vraag te formuleren waarmee je aan de slag gaat en je goed af te vragen wat het einddoel van je onderzoek is. Dat lijkt een open deur maar zeker bij grote onderzoeken is het goed om dat in het achterhoofd te houden omdat je het oorspronkelijke doel van het onderzoek al snel uit het oog kunt verliezen als je op interessante zijwegen stuit.85 Ook Bas Broekhuizen adviseert om vanuit een journalistieke vraag te beginnen. Gewoon, zoals ander redactiewerk ook gebeurt. Vervolgens kijk je of je data kunt vinden die je helpen de vraag te beantwoorden.86 De docent Journalistiek en Nieuwe Media beschrijft ter illustratie wat hij zag op de hackevenementen die hij bijwoonde. Die jongens gaan los op data, maar leveren uiteindelijk iets dat geen vraag beantwoordt. Je krijgt een visualisatie van alle openbare toiletten in Amsterdam, welk verhaal vertel je daarmee?87 Op zich klinkt zijn kritiek voor een journalist heel plausibel. Want inderdaad: waar is het verhaal? Een journalistieke productie moet immers een verhaal vertellen. Toch? Maar je zou, net als Adrian Holovaty, deze vraag ook simpelweg kunnen pareren met: Who cares? Een mooi, toelichtend verhaal zou wellicht een mooie aanvulling zijn op zon visualisatie, maar zou een helder overzicht van de openbare toiletten in Amsterdam niet best handig kunnen zijn voor bijvoorbeeld lezers van het Parool? In dit onderzoek wordt zoiets echter niet gezien als datajournalistiek, aangezien journalistiek inderdaad een verhaal moet vertellen. Wanneer die visualisatie een verhaal zou vertellen, zou dit het stempel journalistiek verdienen. Maar aangezien het alleen een overzicht van toiletten was, valt het buiten dit onderzoek. 3.9 Routines De werkwijze van een journalist wordt niet alleen bepaald door de stadia van het totstandkomingsproces, maar ook door andere elementen van zijn werkwijze. Journalisten werken volgens een set van regels, normen en procedures: hun routines. Dit werd in 1957 al opgemerkt door Bruce Westley en Malcolm Maclean, twee grondleggers van de journalism

Carin Beenen in reactie op Paul Vereijken, 'Hoe begin je met datajournalistiek?' Spotlight Effect (05-07-2011) www.spotlighteffect.nl/journalistiek/hoe-begin-je-metdatajournalistiek. 86 Jerry Vermanen, 'Alles om ons verandert in data' RegioHack (15-09-2011) www.regiohack.nl/interviews/alles-om-ons-verandert-in-data/. 87 Ibidem.

85

35

NERD MET VIJF POTEN

MASTERSCRIPTIE JAN KRUIDHOF

studies.88 In de jaren negentig omschreven de academici Pamela Shoemaker en Stephen Reese routines als: Patterned, routinized, repeated practices and forms that media workers use to do their jobs.89 Een voorbeeld van zon routine is de deadline, die een vaste plek heeft in het journalistieke proces en dat proces ook benvloedt. De socioloog Gaye Tuchman, die routines als eerste koppelde aan journalistiek, zag routines als strategische rituelen.90 Die routines spelen een grote rol in de nieuwsselectie. Er is weinig tijd, ruimte en geld en vanuit dit oogpunt is het efficint om aan de hand van routines te bepalen aan welk nieuws aandacht wordt besteed. Routines hebben ook een nadelige kant. Volgens Reese conditioneren ze de autonomie en invloed van journalisten, terwijl die zich hier niet van bewust zijn. Datajournalistiek is een nieuwe manier van werken. Maar journalisten houden vaak juist vast aan een bekende manier van werken. De Nederlandse communicatiewetenschapper Mark Deuze stelt dat journalisten wel erg gehecht aan hun routines. Journalisten lijken volgens hem een dubbele houding te hebben ten opzichte van vernieuwing en verandering in het vak. Journalisten staan positief tegenover ontwikkelingen die het werk vergemakkelijken, maar zijn huiverig als het erom gaat de aangeleerde werkwijzen daadwerkelijk te veranderen en echt gebruik te maken van allerlei nieuwe mogelijkheden.91 Nauw verbonden met routine is de werkverdeling. Hoe zijn de verhoudingen tussen verschillende journalisten? Deuze stelt dat journalisten niet alleen werken volgens patronen en routines, volgens vaak ongeschreven regels en afspraken, maar ook binnen een tamelijk hirarchische redactie.92 De manier waarop een journalist en een nieuwsorganisatie projecten organiseren heeft ook invloed op het eindproduct, concludeerden de sociologen Herbert Gans en Todd Gitlin. Neem de journalistieke gewoonte om artikelen oprolbaar te maken. Van een journalist wordt verwacht dat hij in een nieuwsverslag allereerst meldt wat volgens hem het belangrijkste is. Dat zit zo in het denken van een journalist gebakken dat hij het bijna niet meer doorheeft. Maar hiermee heeft de beoordeling van de situatie door de journalist vanzelfsprekend ook invloed op het uiteindelijke artikel. Journalistieke routines hebben ook het denken van de nieuwsconsument benvloed. De Amerikaanse historicus en wetenschapsfilosoof Thomas Kuhn, die bekend werd met het introduceren van de term paradigmashift, omschreef paradigmas wel als manieren om de
88

Bruce Westley en Malcolm MacLean, A conceptual model for communications research Journalism Quarterly (1957) 31-38, aldaar 34. 89 Pamela J. Shoemaker en Stephen D. Reese, Mediating the message (New York 1996) 100. 90 Gaye Tuchman, Making news by doing work: Routinizing the unexpected American Journal of Sociology 77 (1979) 110-131. 91 Mark Deuze, Wat is journalistiek? (Amsterdam 2004) 58. 92 Idem, 153.

36

NERD MET VIJF POTEN

MASTERSCRIPTIE JAN KRUIDHOF

werkelijkheid te representeren gebaseerd op breed gedragen aannames over hoe informatie verzameld en genterpreteerd dient te worden. Het is erg belangrijk om te beseffen dat zon paradigma niet garandeert dat de informatie die je krijgt de waarheid is. Het is simpelweg een manier om ons informatie te geven op een manier die wij accepteren. Zulke routines hebben goede kanten: hoor en wederhoor zorgt er bijvoorbeeld voor dat meerdere kanten van een verhaal belicht worden. Maar wat als je niet op twee, maar op wel drie of dertig manieren naar een verhaal kunt kijken? Als journalist val je dan al snel terug op de routine van hoor en wederhoor. Je kiest een voorstander, je kiest een tegenstander en klaar: jij hebt je werk netjes gedaan. En de kijker denkt: dit is kennelijk de situatie. Er is een voorstander die zus zegt en een tegenstander die zo zegt. Dat er misschien wel tig andere manieren zijn om naar een verhaal te kijken vergeten we al snel, omdat we zo gewend zijn aan die paradigmas en routines. Zo kan ook datajournalistiek haar routines en paradigmas ontwikkelen. Dat kan voordelen hebben, maar ook nadelen. Een journalist kan er zijn werk mee vergemakkelijken, maar ze kunnen hem ook in de weg zitten. Wat zou er bekend zijn over routines binnen de datajournalistiek?

37

NERD MET VIJF POTEN

MASTERSCRIPTIE JAN KRUIDHOF

4. Methode
Het doel van dit onderzoek is om na te gaan in hoeverre de werkwijze en routines van Nederlandse media verschillen waar het gaat om datajournalistiek. Om in kaart te kunnen brengen hoe Nederlandse journalisten datajournalistieke items aanpakken heb ik contact gezocht met de journalisten die hier in Nederland het meest intensief mee bezig zijn en heb ik hun genterviewd.93 4.1 De respondenten In eerste instantie ben ik op zoek gegaan naar datajournalisten die zichzelf als zodanig omschrijven, door anderen zo worden omschreven en/of specifiek met datajournalistiek bezig zijn. Zodoende kwam ik terecht bij een eerste selectie van respondenten, namelijk Arlen Poort, Dimitri Tokmetzis, Jerry Vermanen en Laura Wismans. Deze groep was nog te klein voor een wetenschappelijk onderzoek, dus heb ik ook afspraken gemaakt met mensen die wel intensief bezig zijn met datajournalistiek, maar zichzelf niet volledig beschouwen als makers van datajournalistiek. Dit waren Erik Bloem, Jasper Koning en Anke Vellenga. Hieronder worden zij aan u voorgesteld. Erik Bloem (Altijd Wat) Erik Bloem is onderzoeksjournalist bij het televisieprogramma Altijd Wat. Hij studeerde Frans met Europese Studies en volgde de Postdoctorale Opleiding Journalistiek. Hij werkte voor NRC Handelsblad en de Volkskrant, waar hij meewerkte aan onderzoeken naar invloedrijke Nederlanders en straffen in Nederland. Hij werkte voor de Volkskrant ook als redacteur economie. Altijd Wat heeft de opzet van een magazine op tv. De redactie bestaat grotendeels uit de oude redactie van Netwerk. Jasper Koning (Nederland van Boven) Jasper Koning was eindredacteur van Nederland van Boven. Hij studeerde journalistiek en ging daarna bij computermagazine PC Magazine werken. Als webredacteur werkte hij voor de NCRV en ICT-nieuwssite ZDNet. Daarna ging hij aan de slag bij de VPRO, waar hij verschillende
Enkele van de journalisten zijn fulltime bezig met datajournalistiek, maar voor anderen is datajournalistiek (nog) een zijproject. Aangezien niet iedereen zichzelf beschouwt als datajournalist, zullen zij in dit onderzoeksverslag eenvoudigweg aangeduid worden als journalisten of respondenten.
93

38

NERD MET VIJF POTEN

MASTERSCRIPTIE JAN KRUIDHOF

websites onderhield, projectmanager werd en nu werkt als redacteur digitaal voor Tegenlicht. Arlen Poort (NRC Handelsblad) Arlen Poort studeerde aan de School voor Journalistiek en liep stage bij NRC Handelsblad. Daar werkte hij vanaf 1996 voor de bijlage Profiel aan de graphics en tegenwoordig is hij eindredacteur Binnenland. Datajournalistiek doet hij hiernaast. Voordat hij bij het NRC Handelsblad begon was hij verslaggever voor de Havenloods in Rotterdam. Andr Tak (RTL Nieuws) Andr Tak is cordinator van de onderzoeksredactie van RTL Nieuws. Eerder werkte hij voor het VARA-televisieprogramma Zembla. In 2011 stelde het Stimuleringsfonds 92.500 beschikbaar voor de RTL Nieuws Facts. Deze feitensite, waar allerlei statistieken over veiligheid, verkeer, zorg en geld zijn te raadplegen, werd in februari 2013 gelanceerd. Dimitri Tokmetzis (Sargasso) Dimtiri Tokmetzis is hoofdredacteur van het groepsblog Sargasso. Hij studeerde geschiedenis en ging daarna de journalistiek in. Hij was algemeen verslaggever bij het Utrechts Nieuwsblad en richtte zich daarna op onderzoeksjournalistiek. Later werkte hij op de onderzoeksredactie van NRC Handelsblad en als freelancer. Dimitri is tevens de auteur van De Digitale Schaduw, een boek over privacykwesties waarin hij waarschuwt voor de gevaren van een oncontroleerbare digitale identiteit. Sargasso kon in 2011 dankzij een startsubsidie van het Stimuleringsfonds voor de Pers 84.471 een datajournalist aannemen. Anke Vellenga (NOS) Anke Vellenga is bij de NOS informatiespecialist op de afdeling Documedia, waar research wordt gedaan en het beeld- en tekstarchief wordt bijgehouden. Ze studeerde Informatiedienstverlening en -management, een opleiding waarbij je leert hoe je met informatie omgaat en hoe je dat kan managen in een organisatie. Daarna werkte ze bij RTL, waar ze zich bezighield met research en archiveren, en het Algemeen Dagblad, waar ze zich focusde op research. Daarnaast heeft ze de master Media en Journalistiek gedaan. Op dit moment is ze bezig met de postdoc Internationale Researchjournalistiek.

39

NERD MET VIJF POTEN

MASTERSCRIPTIE JAN KRUIDHOF

Jerry Vermanen (Nu) Jerry Vermanen is datajournalist bij de website Nu. Hij studeerde Industrieel Ontwerpen (bachelor) en Journalistiek & Nieuwe Media (master). Hij liep stage bij het ANP en werd hierna internetredacteur bij regionaal dagblad de Stentor, waar hij Regiohack opzette en leidde. Jerry schreef ook mee aan het Data Journalism Handbook. Laura Wismans (nrc.next) Laura Wismans werkt als (data)redacteur en factchecker bij nrc.next. Ze studeerde communicatiewetenschappen en journalistiek, werkte kort voor Elsevier en ging daarna als dataredacteur aan de slag voor Sargasso en het ANP. Laura zit ook in het bestuur van open datastichting Open State (een fusie van Het Nieuwe Stemmen en Hack de Overheid). De respondenten zijn werkzaam voor verschillende soorten media: een van hen werkt voor een groepsblog, een ander voor een nieuwssite, twee voor een krant, twee voor multimediale nieuwsorganisaties en twee voor een televisieprogramma. Het idee hierachter was, dat kon worden vergeleken of journalisten verschillende werkwijzen hebben als zij datajournalistieke producties maken voor nieuwsorganisaties die verschillende mediavormen als primair kanaal gebruiken. Ik heb in de zomer van 2012 ook contact gezocht met Sybren Kooistra, die inmiddels als datajournalist werkt voor de Volkskrant, maar hij had op dat moment naar eigen zeggen nog (te) weinig zicht op zijn taken, routines en workflow. Een andere datajournalist is Frdrik Ruys, die meewerkt aan Nederland van Boven. Ik heb hem niet geinterviewd, maar Jasper Koning wel en die heeft uitgebreid verteld over de totstandkoming van dit programma. Ook heeft Ruys de voorlopige versie van deze scriptie gelezen en van commentaar voorzien. Buiten Kooistra en Ruys is er bij mijn weten niemand in Nederland intensief bezig met datajournalistiek. 4.2 De interviews Dit onderzoek is opgezet als kwalitatief onderzoek. Het doel van kwalitatief onderzoek is om onder meer gedragingen en ervaringen van betrokkenen te beschrijven en interpreteren op een manier die de natuurlijke omgeving zo min mogelijk verstoort. In het onderzoek is als methode gekozen voor het kwalitatieve onderzoeksinterview. Dit is een methode van dataverzameling waarbij niet strikt wordt vastgehouden aan van tevoren geformuleerde vragen over een bepaald onderwerp, maar waarbij gebruik wordt gemaakt van een lijst met onderwerpen. Op deze manier kon ik een interview aanpassen aan de loop van het gesprek. Binnen het kwalitatief

40

NERD MET VIJF POTEN

MASTERSCRIPTIE JAN KRUIDHOF

interview bestaan twee vormen: het ongestructureerd en het semi- of half-gestructureerd interview. Hier heb ik gekozen voor het semi-gestructureerde interview. Deze structuur is er op gericht om de waarde en betrouwbaarheid van sleutelbegrippen te optimaliseren.94 Hierbij is slechts een deel van de vragen en gespreksonderwerpen van tevoren vastgesteld en bestaat ook de ruimte om hiervan af te wijken. Datajournalistiek zoals die momenteel wordt beoefend is nog een relatief nieuw werkveld en over de werkwijze was nog zoveel onduidelijk, dat een volkomen gestructureerde interviewmethode de kans op onverwachtse en wellicht des te interessantere resultaten zou doen afnemen. Een semi-gestructureerd interview kan er toe leiden dat het gesprek op andere zaken komt die de onderzoeker niet eerder in aanmerking had genomen, maar die belangrijk voor zijn begrip kunnen zijn. Dit kan helpen om onderzoeksvragen te beantwoorden of te formuleren.95 De interviews vonden plaats in de periode van juli tot en met oktober 2012. Ik heb de respondenten eerst via een e-mail gevraagd of zij mee wilden werken aan de interviews en heb daarna een afspraak gemaakt. Voorafgaand aan de interviews heb ik mij verdiept in het werk van iedere respondent. Zo kon ik vragen hoe de respondent bij specifieke items te werk was gegaan. Daarna ben ik voor bijna alle interviews naar de werkplek van de respondenten gereisd. Zodoende hoefden zij weinig moeite te doen en kon het gesprek plaatsvinden in een voor hen vertrouwde omgeving. Alleen het gesprek met Andr Tak is om praktische redenen telefonisch gehouden. De gesprekken duurden een uur tot anderhalf uur. Alleen het gesprek met Andr Tak was korter, dit duurde ongeveer veertig minuten. Alle gesprekken werden opgenomen met een voicerecorder. Daarnaast maakte ik aantekeningen. Geen artikel is hetzelfde en ieder project heeft specifieke eigenschappen. Wanneer gevraagd zou worden naar een algemene workflow zou het voor een datajournalist wellicht moeilijk zijn om een antwoord te geven dat voor ieder project van toepassing is. Ik heb me daarom voorgenomen te vragen naar een paar voorbeeldcasussen die als uitgangspunt gebruikt kunnen worden. Ik was dan benieuwd naar - een item waar ze heel trots op zijn - een item waar het productieproces heel goed verliep - een item waar het productieproces moeizaam verliep Deze vragen heb ik niet bij ieder interview allemaal expliciet hoeven stellen om een antwoord te krijgen. Na afloop van de gesprekken zijn alle interviews volledig getranscribeerd. Hierbij werd de
Alan Bryman, Social Research Methods (Oxford 2004) 313. Mark Saunders, Philip Lewis en Adrian Thornhill, Methoden en technieken van onderzoek; derde editie (Amsterdam, 2004) 261.
95 94

41

NERD MET VIJF POTEN

MASTERSCRIPTIE JAN KRUIDHOF

opgenomen tekst letterlijk uitgeschreven. In hoofdstuk 8 zijn alle transcripties terug te vinden. Vervolgens zijn de interviews geanalyseerd. 4.3 Analyse van de interviews Om de interviews te analyseren is gekozen voor de analysemethode van de gefundeerde theoriebenadering. Het belangrijkste onderdeel van deze analysemethode is de constante vergelijking.96 De analyse van het onderzoek werd uitgevoerd in drie stappen, zoals die beschreven zijn door de Nederlandse sociologe Hennie Boeije. Zij noemt deze analysemethode ook wel de onderzoeksslang. Deze onderzoeksslang slingert gedurende het gehele onderzoek, zowel in de theoretiserende fase als de beschrijvende fase, heen en weer tussen gegevens, activiteiten en resultaat. De slang begint bij het verzamelen van gegevens: de interviews. De eerste activiteit is vervolgens het open coderen. Hierbij worden de getranscribeerde interviewteksten gefragmenteerd, beoordeeld op relevantie en voorzien van steekwoorden. Dit resulteert in een lijst met codes. De tweede fase is het axiaal coderen. Hierbij worden stukken tekst die in de eerste fase dezelfde code hebben gekregen vergeleken op verschillen en overeenkomsten. De zogenaamde onderzoeksslang wordt afgesloten in fase drie, waarin gezocht wordt naar uitzonderingen op de gevonden codes. De onderzoeksbegrippen worden vergeleken met de literatuur.97 Door het volgen van de onderzoeksslang vergelijk je costant je onderzoeksresultaten met de literatuur en je verwachtingen. Na het opsturen van de voorlopige versie van de scriptie reageerde een enkele respondent met opmerkingen. Ook andere betrokkenen lazen de voorlopige versie en gaven op- en aanmerkingen. 4.4 Thema's Voor de interviews heb ik het onderwerp opgedeeld in de volgende thema's: De workflow Voor beginnende datajournalisten is het lastig een aanpak te ontwikkelen. Zij kunnen wat opsteken van de verschillende werkwijzen van andere media. Daarnaast is het interessant om te onderzoeken in hoeverre media die zich primair op verschillende verschijningsvormen richten van aanpak verschillen. Zijn we echt in het multimediale tijdperk aanbeland?

Hennie Boeije, Analyseren in kwalitatief onderzoek. Denken en doen (Amsterdam 2005) 75. 97 Ibidem, 80-98.

96

42

NERD MET VIJF POTEN

MASTERSCRIPTIE JAN KRUIDHOF

De doelstelling Het uiteindelijke doel kan zijn om zo snel mogelijk data te publiceren bij actueel nieuws. Het kan ook zijn om iets te onthullen wat nog niet openbaar was. Of: lezers de mogelijkheid geven om zelf informatie te vinden. Elke optie vergt een heel andere aanpak. De onderwerpen Wie uitgaat van een bepaalde bron, wordt daardoor beinvloedt. De bron is dan leidend. Dit levert een ander verhaal op dan wanneer je uitgaat van een specifieke vraag. Wanneer de datajournalistiek een soort aanvulling is op een groter verhaal, heeft dit ook gevolgen. De medewerkers De manier waarop een journalist te werk gaat beinvloedt zijn items. Net zoals zijn werkomgeving of zijn eerdere werkervaring zijn werkwijze kan beinvloeden. Hebben ze een journalistieke achtergrond of zijn het van origine designers? Zijn ze jong met frisse ideeen of ouder met veel ervaring? Daarnaast is de werkverdeling binnen het team van belang. Bij een grote redactie (zoals NOS, RTL, Volkskrant of NRC) kunnen de taken meer verdeelt worden. Bij Nu is maar een datajournalist. Sargasso organiseerde hackathons. Dit heeft ongetwijfeld gevolgen voor de totstandkoming van de verhalen, maar welke precies? De organisatie De werkwijze van een nieuwsorganisatie, ook van de niet-datajournalistieke afdelingen, kan direct of indirect invloed hebben op de datajournalistieke producties. Als de hele organisatie bijvoorbeeld gewend is aan hele korte deadlines is het moeilijker voor een datajournalist om meer tijd vrij te krijgen voor een project. De volledige topiclijst die gebruikt is voor de interviews is terug te vinden in de bijlagen.

4.5 Kwaliteit van het onderzoek Bij de uitvoering van wetenschappelijk onderzoek is het uiteraard van belang dat dit onderzoek een betrouwbare weergave van de werkelijkheid is. Het werkelijkheidskarakter en de juistheid van wetenschappelijke studies hebben, zoals Hennie Boeije beschrijft, betrekking op enerzijds de validiteit van uitspraken die onderzoekers doen op de grond van de resultaten van hun onderzoek, en anderzijds op de navolgbaarheid van het

43

NERD MET VIJF POTEN

MASTERSCRIPTIE JAN KRUIDHOF

onderzoeksproces dat tot die resultaten heeft geleid.98 Validiteit draait om de beinvloeding van het onderzoek door systematische fouten. Wanneer onderzoekers meten wat zij beogen te meten, wordt dat gezien als validiteit. In dit onderzoek is op verschillende manieren geprobeerd om deze factoren te waarborgen. De validiteit kan bijvoorbeeld bedreigd worden doordat een deel van de doelpopulatie niet kan of wil meewerken aan het onderzoek.
99

Aangezien bijna iedereen die in Nederland intensief bezig is met datajournalistiek geinterviewd is voor dit onderzoek, is de validiteit op dit punt bijvoorbeeld gewaarborgd. Ter bevordering van de navolgbaarheid van het onderzoeksproces wordt hier allereerst de onderzoeksmethode besproken. Daarnaast is de werkwijze navolgbaar gemaakt door relevante documentatie in de bijlage op te nemen. Zo is de topiclijst voor de interviews in de bijlage terug te vinden en daarnaast zijn alle interviews volledig getranscribeerd en opgenomen in de bijlage. Wie wil kan de interviews nalezen en controleren hoe de bevindingen uit dit onderzoek tot stand zijn gekomen. Tot slot hebben verschillende betrokkenen, die geinterviewd zijn of anderzijds betrokken zijn bij datajournalistiek, het onderzoek nagelezen in het kader van zogenaamde member validation of member checks.100 Zij hadden geen kritiek op hoe de interviews zijn weergegeven of de conclusies die eruit zijn getrokken. Wel zijn er nog enkele updates toegevoegd, zodat de gegeven informatie zo actueel mogelijk is. Op grond van deze aspecten mag de lezer ervan uitgaan dat dit een betrouwbaar onderzoek is.

Hennie Boeije, Kwalitatief onderzoek in: Harm t Hart, Hennie Boeije en Joop Cox (ed.), Onderzoeksmethoden (Den Haag 2009) 247-281, aldaar 273. 99 Idem, 274. 100 Idem, 275.

98

44

NERD MET VIJF POTEN

MASTERSCRIPTIE JAN KRUIDHOF

5. Onderzoeksresultaten
In dit hoofdstuk zullen de onderzoeksresultaten gepresenteerd worden. Op basis van de themaverdeling en de codering tijdens de analyse zijn verschillende paragrafen opgesteld waarin te lezen valt wat de respondenten over bepaalde themas zeggen. Een kleine opmerking vooraf: voor de volledigheid wordt hieronder zo precies mogelijk vermeld hoeveel van de genterviewden een bepaald standpunt innamen. Tenzij anders vermeld, wil dit niet automatisch zeggen dat de overige genterviewden niet op die manier werken. Het kan bijvoorbeeld zijn dat de overige sprekers niets over het bewuste onderwerp hebben gezegd. 5.1 Doelstelling Een van de factoren die bepaalt hoe je als nieuwsorganisatie te werk gaat, is je doelstelling. Je zou er vanuit kunnen gaan dat nieuwsorganisaties logischerwijs het doel hebben om nieuws te brengen. Maar wie datajournalistieke projecten in het buitenland bekijkt, merkt dat nieuwsorganisaties anders dan hun naam doet vermoeden zich hierbij niet alleen op nieuwsonderwerpen focussen. Sommige items zijn niet zozeer nieuws, maar bieden meer inzicht in een bekend fenomeen. Hoe zou dit zijn in Nederland? Is nieuwswaarde een vereiste voor hun dataprojecten? En zo niet, wat dan wel? Na analyse van de interviews kan het volgende worden geconcludeerd:

Bij vier van de zeven organisaties die in dit onderzoek aan bod komen, is het brengen van nieuws het voornaamste doel. Bij deze organisaties wordt van de meeste items verwacht dat ze nieuws bevatten en datajournalistieke items vormen hierop geen uitzondering.

De overige drie organisaties maken ook graag nieuws, maar nieuwswaarde is geen vereiste voor hun producties. Zij vinden het ook interessant om meer inzicht te verschaffen in dingen die al bekend zijn of belichten de bekende werkelijkheid graag op een verrassende manier.

Twee organisaties hebben zowel als doel om data te visualiseren als om zelf data te vinden om daar nieuws uit te halen. Het visualiseren is volgens hen een stuk makkelijker dan het zelf vinden van data.

Vier organisaties stelden expliciet dat ze proberen hun data zo persoonlijk mogelijk aan hun publiek te presenteren.

45

NERD MET VIJF POTEN

MASTERSCRIPTIE JAN KRUIDHOF

5.1.1 Nieuwswaarde als harde eis Bij vier organisaties is het een vereiste dat hun dataproducties nieuws bevatten. Bij RTL Nieuws is die eis het hardste: hier wordt zelfs verwacht dat dataprojecten de opening van het nieuws vormen. Ook bij het NRC Handelsblad is nieuwswaardigheid een eis. Er moet bij de krant een trend, ontwikkeling of iets onverwachts in de data zitten. Wat iedereen al weet of verwacht is volgens Arlen Poort niet spannend om op te schrijven. Daarom heeft hij op de redactie de regel gesteld dat er altijd een nieuwskop boven een graphic moet staan. Bijvoorbeeld: Meeste moorden in Amsterdam boven een kaart waarop Amsterdam naar voren springt. Zo wil de krant laten zien wat het nieuws is, maar ook waarom een lezer een artikel moet lezen en wat hij eruit kan concluderen. Gelukkig gebeurt er volgens Poort altijd wel wat in data. Hij zit op een lijn met Jerry Vermanen van Nu. De populaire site heeft eveneens de doelstelling om nieuws te brengen zo snel en duidelijk mogelijk. Bezoekers van Nu zijn volgens Vermanen mensen die snel het nieuws willen weten, die binnen anderhalve minuut een berichtje willen doornemen en het dan volledig willen snappen. Achtergrondnieuws zien ze niet als hun kracht. Bij de NOS is het eigenlijk wel de bedoeling dat datajournalistieke items nieuws bevatten, maar Anke Vellenga vindt persoonlijk dat de omroep best meer aandacht mag besteden aan achtergronden. Soms doet ze dat wel, maar praktisch is het simpelweg lastig om achtergrondartikelen een plek te geven binnen de NOS. De organisatie was vroeger gericht op televisie, maar nu is internet first. En de website is vooral een nieuwssite. Het is voor de internetredactie lastig om achtergrondnieuws weg te zetten binnen de site. Vellenga: In het blokje laatste nieuws heb je dan een achtergrondverhaal, dat klopt eigenlijk niet. 5.1.2 Nieuws niet het enige doel Erik Bloem van NCRVs Altijd Wat ziet vaak dat datajournalistiek dingen oplevert waarvan hij denkt: Ohja, dat wist ik eigenlijk al wel een beetje en nu is het in kaart gebracht. Dat is niet het soort onderzoek dat hij wil verrichten. Hij wil hard nieuws. Eigenlijk wil ik dat mensen schande zeggen. Nu hoeft dat niet altijd, maar je wilt wel tegels lichten. Maar dat is lastig met datajournalistiek, merkt hij. En Altijd Wat is bovendien ook geen nieuwsprogramma, maar een opinieprogramma. De makers vinden het leuk om nieuws te maken, maar dat kan niet elke week en dat is ook niet hun streven. Ze willen spraakmakende verhalen maken. Afstand nemen van het hijgerige en laten zien hoe het nou eigenlijk echt zit. Altijd Wat wil een ander licht laten schijnen op de samenleving. De bekende werkelijkheid in beeld brengen vanuit een verrassende invalshoek was ook het doel van de makers van Nederland van Boven. Zij wilden Nederland laten zoals een kijker of

46

NERD MET VIJF POTEN

MASTERSCRIPTIE JAN KRUIDHOF

bezoeker dat nog nooit had gezien. Dat deed het programma vooral met helikopterbeelden. Wat niet met de helikopter gefilmd kon worden, werd getoond in datavisualisaties. De makers waren op zoek naar een nieuwe manier om naar Nederland te kijken, wat in die zin wel nieuws was. Maar ze zochten eerder de verrassing dan hard nieuws. De redactie kreeg veel reacties op een fragment dat helemaal geen nieuws was. In dit fragment zag de kijker een meeuw die van Texel naar Amsterdam vliegt. Eindredacteur Jasper Koning: Het is niet wereldschokkend, maar het brengt wel bij veel mensen het besef: Jemig, een vogel vliegt dus in een dagje van Texel naar Amsterdam. Ook bij Sargasso is nieuws geen vereiste voor de datajournalistieke items. Het langetermijndoel van het groepsblog is het vormen van een kwaliteits online medium. De makers willen op een vernieuwende manier goede verhalen maken en datajournalistiek is een van die manieren. Anders dan bij bijvoorbeeld de NRC kan bij Sargasso iets wat algemeen bekend is wel de moeite waard zijn om te publiceren. Zo zag een blog in een Twitteronderzoek dat iedereen op het Binnenhof totaal geobsedeerd is door Pauw & Witteman. Dimitri Tokmetzis vindt het toch leuk om dat soort dingen duidelijk te maken. Dat weet iedereen, maar het is wel goed om dat af en toe ook te laten zien. Soms gaat het bieden van achtergrondinformatie en nieuws ook samen. Bijvoorbeeld met de hackathon over politieke data, die door Sargasso werd georganiseerd. Hiermee probeert het blog achtergrondinformatie te bieden, maar uit zon hackathon verwacht Tokmetzis ook wel nieuws te halen. 5.1.3 Visualiseren makkelijker dan data vinden Het ene doel is soms lastiger te realiseren dan het andere. Twee nieuwsorganisaties (Nu en NOS) lieten weten dat hun doel enerzijds is om data te visualiseren en anderzijds om zelf data te verzamelen om daar vervolgens nieuws uit te halen. Beiden gaven los van elkaar aan dat het visualiseren van bestaande data een stuk makkelijker is dan het zelf vinden van data. Op het verkrijgen van data wordt hieronder nog dieper ingegaan. 5.1.4 Persoonlijk maken De journalisten die voor dit onderzoek zijn genterviewd zijn, doen erg hun best om hun producties persoonlijk te maken voor hun publiek. RTL Nieuws wil met datajournalistiek zoveel mogelijk gegevens waar het publiek zelf wat aan heeft inzichtelijk maken. Het liefst doet het programma dit door gegevens te koppelen aan de woonplaats van de gebruiker. Dat is eigenlijk de belangrijkste doelstelling, stelde Andr Tak. Mensen kunnen zo zien hoe de plek waar zij wonen functioneert ten opzichte van andere plaatsen.

47

NERD MET VIJF POTEN

MASTERSCRIPTIE JAN KRUIDHOF

De datajournalistiek van de NOS is op een soortgelijke manier begonnen. De medewerkers vroegen zich af hoe ze verhalen waar cijfers in voorkomen mooier kunnen presenteren voor mensen en inzichtelijker kunnen maken. Een bezoeker moet kunnen uitzoeken wat het nieuws voor hem persoonlijk betekent. De makers van Nederland van Boven hebben zich ten doel gesteld om data altijd te verpakken in een aansprekend, persoonlijk verhaal, dat herkenbaar is voor kijkers. Ieder onderdeel van het programma, hoe klein ook, moest een verhaallijntje hebben. Dit was een van de twee belangrijke elementen die volgens Jasper Koning goed werkten in de eerste serie van het programma. Het andere element was het in beeld brengen van pure complexiteit. Grote hoeveelheden, enormiteit. Koning: Ik denk dat dit een mannelijke appeal is en dat persoonlijke verhaal meer de vrouwelijke appeal is. 5.2 Onderwerpen Wat maakt een onderwerp meer of minder geschikt voor datajournalistiek, volgens de nieuwsorganisaties die hier in Nederland mee bezig zijn? En welke factoren spelen een rol bij het kiezen van een onderwerp? Dit is de ervaring van de genterviewde journalisten.

Drie van de zeven genterviewden stellen dat ze door tijdgebrek niet toekomen aan onderwerpen die ze wel zouden willen behandelen.

Twee organisaties pakken in principe ieder onderwerp aan voor datajournalistiek. Onderwerpen als discriminatie, zorg en migratie komen veel voor in datajournalistiek. De overheid geeft hier veel gegevens over vrij.

Voor datajournalistiek op televisie gelden speciale eisen. Zo helpt het als een onderwerp dramatisch is en als er beweging in zit.

Een multimediale opzet kan een project meerwaarde bieden, maar het beperkt ook de mogelijkheid om gaandeweg het project van onderwerp te veranderen.

Ook bij het kiezen van onderwerpen wordt gefocust op onderwerpen die het publiek persoonlijk raken. Onderwerpen die het publiek niet raken zijn moeilijk te slijten, ook al zijn ze belangrijk.

5.2.1 Tijdgebrek Een onderwerp kan om verschillende reden niet geschikt zijn voor een dataproject. Drie journalisten gaven aan dat ze over het algemeen weinig tijd hebben en dat ze daardoor sowieso maar weinig onderwerpen kunnen behandelen. Dimitri Tokmetzis vertelde dat hij wel van grote

48

NERD MET VIJF POTEN

MASTERSCRIPTIE JAN KRUIDHOF

projecten houdt, maar dat die ook wel veel tijd kosten. Hij was ten tijde van het interview bijvoorbeeld met een aantal non-gouvernementele organisaties in gesprek om een hackathon te organiseren over de Europese lobby, om die in kaart te brengen. Maar dat kost gewoon veel tijd. Arlen Poort heeft hetzelfde probleem. Naast zijn werk als eindredacteur voor de binnenlandredactie heeft hij niet zoveel tijd om andere dingen te doen. Als hij dat wel zou hebben, zou hij dingen met sport doen. Er worden volgens hem nergens zoveel rare statistieken over verzameld als over sportwedstrijden. Daar kun je natuurlijk hele mooie dingen mee vergelijken. Ook Anke Vellenga doet haar datajournalistieke werk naast haar gewone werkzaamheden, in haar geval als informatiespecialist. Ze komt aan veel dingen niet toe omdat ze er te weinig tijd voor heeft. Ze heeft bijvoorbeeld niet altijd tijd om de vaardigheden onder de knie te krijgen die voor het behandelen van een onderwerp nodig zijn. 5.2.2 Beschikbaarheid en aandacht Onderwerpen als discriminatie, zorg en migratie komen van oudsher vaak aan bod in CAR en datajournalistiek. Volgens Arlen Poort komt dit doordat overheidsgegevens vaak met deze onderwerpen te maken hebben. Informatie over bijvoorbeeld bedrijven is vaak moeilijker te verkrijgen. De oorzaak ligt volgens hem dus puur in het feit dat gegevens over deze onderwerpen zo gemakkelijk beschikbaar zijn. Sargasso heeft ook veel aandacht besteed aan migratie, maar volgens Dimitri Tokmetzis is dit om andere redenen het geval. Enerzijds omdat er zoveel onzin over wordt gezegd, anderzijds [is het] ook toeval want een van onze vrijwilligers zit daar heel goed in. Dus die levert altijd hele goede data. Bovendien vond de redactie het ook een belangrijk onderwerp. Maar sommige onderwerpen maken weinig kans, ook al vindt de redactie ze belangrijk. Tokmetzis zou bijvoorbeeld graag bezig willen met de Europese Unie, een belangrijk onderwerp. Maar daar trek je weinig lezers mee, weet hij. Ik weet nu al dat ik dat verhaal moeilijk kan slijten. 5.2.3 Veel soorten onderwerpen De website Nu probeert bij het verzamelen van haar data nu nog allerlei verschillende onderwerpen. We schieten nu nog heel erg met hagel, we proberen zoveel mogelijk verschillende onderwerpen te raken. Na verloop van tijd zal de site zich proberen te beperken tot een aantal aandachtsgebieden. Criteria voor die onderwerpen zijn onder meer: is er goede en betrouwbare data over dit onderwerp te vinden? Kunnen we ons hiermee onderscheiden van

49

NERD MET VIJF POTEN

MASTERSCRIPTIE JAN KRUIDHOF

andere nieuwsmedia? Hebben we medewerkers die al veel van dit onderwerp weten? Ook bezoekersaantallen spelen een rol. Bij de NOS zijn in principe alle onderwerpen mogelijk. Iedere redactie kan iets aandragen. De economieredactie is veel betrokken bij datajournalistiek, maar de binnenlandredactie ook. De buitenlandredactie iets minder, maar Vellenga zou het zelf wel heel interessant vinden om hiermee bezig te gaan. 5.2.4 Televisie stelt eisen aan datajournalistiek Een opinieprogramma als Altijd Wat heeft, in tegenstelling tot een krant, niet de verplichting om bijna het hele spectrum van het nieuws te behandelen. Je zou in theorie bepaalde onderwerpen een jaar lang links kunnen laten liggen. Dit heeft een voordeel en een nadeel, volgens Erik Bloem. Het voordeel is dat je meer je eigen keuzes kan maken. Het nadeel is dat je, als jij je dan ergens in verdiept, beseft dat je veel hebt gemist en niet weet. Daarin moet je dan opnieuw beginnen. In die zin is een datajournalist dus generalist, aldus Bloem, die overigens benadrukt dat hij zichzelf niet echt als datajournalist ziet. Jasper Koning erkent dat, omdat Nederland van Boven een televisieprogramma is, bewust werd gezocht naar een beetje dramatiek in de verhalen. De makers zochten bijvoorbeeld naar een onderwerp dat iets met gevaar te maken had. Dan ga je over Nederland nadenken en denk je: we moeten iets met water. Op televisie kun je prachtige beelden laten zien, maar het moet niet te statisch worden. GPS-animaties werken volgens Koning het beste, omdat daar beweging in zit. Daarom werd besloten dat in iedere aflevering van het programma minimaal n op GPS gebaseerde animatie moest zitten. Dat werkte beter dan animaties over bijvoorbeeld de ontwikkeling van gebieden. Zoiets leent zich volgens Koning minder goed voor een echt vernieuwend, verrassend beeld. Omdat je dan veel sneller in een soort aardrijkskundigeachtige uitleg terecht komt. Als je bijvoorbeeld aantoont dat er in het Noorden veel grasland is, is dat een kwestie van land groen kleuren. Dan gebeurt er in beeld dus niet zoveel. 5.2.5 Multimediaal project is dwingend Nederland van Boven was een multimediaal project. Op de cover van de VPRO-gids kon je met de Layar-app op je mobiel een speciale datalaag ontdekken en er was ook een uitgebreide website. Doordat die site aan het programma was gekoppeld, waren de onderwerpen dwingender. De makers hebben tijdens de totstandkoming van het programma nog veel veranderd. Op een gegeven moment was er zelfs sprake van om de boel om te gooien, vertelde

50

NERD MET VIJF POTEN

MASTERSCRIPTIE JAN KRUIDHOF

Koning. Toen heb ik gezegd: Dat kan niet, want we zijn al zover met de website, met grote datasets te verzamelen, dat kunnen we niet opeens veranderen. 5.2.6 Persoonlijk De voorkeur voor producties die het publiek persoonlijk aanspreken, die ook bij de doelstellingen aan bod kwam, is ook terug te zien in de onderwerpskeuze. Ook in de keuze van onderwerpen richten veel van de genterviewden zich op persoonlijk aansprekende verhalen. Zo vertelde Dimitri Tokmetzis dat hij voor de korte dagelijkse verhalen die hij voor het ANP schrijft onderwerpen probeert te zoeken die mensen raken of veel mensen aangaan, zodat het voor een hoop mensen interessant is. Als voorbeeld noemt hij de veiligheid van het treinverkeer. Ook wie zelf niet geregeld met de trein reist, kent waarschijnlijk wel iemand die dat wel doet. Erik Bloem stelt dat hij voor de onderwerpen van Altijd Wat een soortgelijk criterium heeft. Verhalen moeten het dagelijks leven van mensen raken. Hij noemt als voorbeeld de zorg, een onderwerp dat heel dicht bij mensen staat omdat veel mensen daarmee te maken hebben. Een tweede criterium dat hij handhaaft, is dat je tegels moet lichten, een inzicht bieden wat er anders niet was geweest. Een inzicht moet het ohja-niveau wel ontstijgen. 5.3 Samenwerken met andere partijen Datajournalisten vertelden bij het bespreken van hun doelstelling al, dat het visualiseren van bestaande data makkelijker is dan zelf data verzamelen. En onder het kopje onderwerpen kon u lezen dat datajournalisten weinig tijd hebben. Maar hoe kom je dan aan nieuwe data? Een van de manieren is om samen te werken met andere partijen, zoals bedrijven, wetenschappers of je publiek. Hoe werkt dit en hoe kun je dit het beste aanpakken? Dit is de ervaring van de genterviewde journalisten. Vraag niet alleen wat de andere partij voor jou kan betekenen, maar ook wat jij voor hem kan doen. Dit is niet alleen beleefd en wel zo eerlijk, maar het kweekt ook goodwill. Crowdsourcing is in de Nederlandse datajournalistiek tot nu toe geen succes. Journalisten betwijfelen of het publiek wel mee wil werken en of de verkregen data betrouwbaar is. Projecten waarbij crowdsourcing werd geprobeerd verliepen problematisch of mislukten. De samenwerking met bedrijven verloopt over het algemeen soepeler. Bedrijven zijn vaak bereid om mee te helpen, al stellen ze soms wel voorwaarden voor het gebruik van

51

NERD MET VIJF POTEN

MASTERSCRIPTIE JAN KRUIDHOF

hun data. Datajournalisten zijn hiertoe bereid, maar maken geen reclame voor de bedrijven. Het grootste obstakel bij het gebruik van data van derden vond Jasper Koning (Nederland van Boven) dat het slechts tot op zekere hoogte te controleren was of de verstrekte data wel waarheidsgetrouw waren. Een ander obstakel was het Commissariaat van de Media, dat data zag als iets van waarde. En de VPRO mag als publieke omroep geen dingen van waarde aannemen. Dit bezorgde Koning veel kopzorgen, maar de zaak is uiteindelijk uitgepraat. 5.3.1 Voor wat hoort wat Sargasso werkt als groepsblog veel samen met vrijwilligers, maar ook met andere organisaties. Dimitri Tokmetzis ziet samenwerken als een goede manier om kosten te besparen. Ik vind onderzoeksjournalistiek heel belangrijk en ik wil dat dit blijft bestaan en ik vind dat online media daar ook een rol in moeten hebben. Dat is ook een reden dat we samenwerken met andere media, om het gewoon betaalbaar te houden voor iedereen. Hij deelt vaak de kosten met samenwerkende partijen. Op die manier heeft het blog leuke content online, kunnen lezers er gratis van profiteren en kan de redactie onderwerpen agenderen die zij belangrijk vindt. Tokmetzis wijst erop dat het belangrijk is om de meewerkende partij ook te helpen. Hij vertelt bijvoorbeeld dat hij altijd op zoek is naar NGOs die veel bezig zijn met een bepaald onderwerp. Sargasso wil dan wel helpen, als het blog ook nieuwswaardige data krijgt. Andere nieuwsorganisaties doen dat ook wel, geeft Tokmetzis toe. Het verschil is dat wij ook echt meehelpen. Volgens Tokmetzis hebben onderzoekers vaak prachtige data waar je journalistiek echt wat leuks mee kan doen, maar zijn veel onderzoekers teleurgesteld door journalisten. Dan hebben ze twee dagen lang die data lopen crunchen en daar een mooi stukje over geschreven en dat wordt dan helemaal ingekort naar een klein stukje achterin de krant. Sommige onderzoekers zouden volgens Tokmetzis daarom niet meer met een van de grote kranten samen willen werken. Sargasso helpt onderzoekers juist mee, stelt Tokmetzis. Bijvoorbeeld met een hackathon. Sargasso krijgt hierme veel data, maar vraagt ook aan de onderzoekers of zij nog dingen nodig hebben of de hackathon zo kunnen uitvoeren data de data bruikbaar wordt voor wetenschappelijk onderzoek. Je merkt dat dit heel veel goodwill kweekt. Maar die mensen zijn ook voor ons aan het werk dus ik vind dat er best iets tegenover mag staan.

52

NERD MET VIJF POTEN

MASTERSCRIPTIE JAN KRUIDHOF

5.3.2 Crowdsourcing Het publiek kan voor een datajournalist een bron van wijsheid vormen en kan hem een helpende hand bieden. Crowdsourcing, zoals het inschakelen van je publiek wordt genoemd, werd populair onder journalisten toen The Guardian het publiek liet grasduinen door declaraties van politici. Een bezoeker kon simpelweg kiezen of een bonnetje de moeite waard was om te onderzoeken of niet. Zo scheidde het publiek het kaf van het koren en konden journalisten zich focussen op de bonnetjes die interessant leken. Ondanks dit succesverhaal is crowdsourcing onder Nederlandse datajournalisten nog niet populair. Arlen Poort van NRC Handelsblad heeft nooit overwogen om lezers in te zetten. Het zou volgens hem wel mooi zijn als mensen dat willen, maar hij denkt niet dat mensen zin hebben om daar al te veel tijd aan te besteden. Ik heb niet eens zin om te helpen als ik op een website kom en er komt zon pop-upje: Mogen we u twee minuten vragen stellen? Zijn collega Laura Wismans stelt daarnaast dat data van derden vaak ook heel onbetrouwbaar is. Jerry Vermanen van Nu stelt ook dat het heel moeilijk is om bijvoorbeeld een goede enqute te maken waar je ook controleert of alle informatie die je verzamelt representatief is en of het allemaal klopt. Bij Nu denken ze er wel over na of we een enquete in kunnen zetten, maar willen ze zich ook niet verplichten om gebruik te maken van dit middel, simpelweg omdat het kan. Bij Nederland van Boven is ook nog gekeken of er iets gedaan kon worden met publieksinteractie. De makers hebben nog overwogen om te vragen om fotos inclusief GPS-informatie van hijskranen te maken. Zo hadden ze een hijskranenkaart kunnen maken en kom je iets te weten over bouwputten. Een ander idee was om met GPS-fotos alle openbare beveiligingscameras in Nederland in kaart te brengen. De reden dat deze projecten niet zijn doorgegaan, is dat de makers te weinig inzendingen verwachtten. We waren nog niet begonnen, niemand kende ons nog. Dan krijg je misschien twintig meldingen binnen. Dat schiet niet op, daar hebben we niets aan. 5.3.3 Pogingen tot crowdsourcing Altijd Wat heeft in samenwerking met Sargasso wel daadwerkelijk geprobeerd om hun publiek in te zetten. Ook hier was het de bedoeling om bouwprojecten in kaart te brengen. Ook was men benieuwd hoeveel bouwprojecten vertraging opliepen. Gaat het juist bij overheidsprojecten mis of ook bij particulieren? Aangezien er veel te weinig mensen reageerden, mislukte het project. Erik Bloem betwijfelt achteraf gezien of het publiek van Altijd Wat het publiek is dat je moet bevragen over dit soort onderwerpen. Omdat wij een wat ouder kijkerspubliek hebben. Dus dat zal een van de redenen zijn geweest. De NCRV-journalisten speelden nog wel met de gedachte

53

NERD MET VIJF POTEN

MASTERSCRIPTIE JAN KRUIDHOF

om bouwprojecten op een andere manier in kaart te brengen, bijvoorbeeld via lokale media. Maar dat is er tot op heden niet van gekomen. Ook een ander project waarin Sargasso lezers inzette verliep niet zonder problemen. In dit project stonden WOB-verzoeken centraal. WOB-verzoeken doen een beroep op de Wet Openbaarheid Bestuur (WOB) die overheidsorganen verplicht om uit eigen beweging informatie over de uitvoering van haar taken te verstrekken, maar ook om op verzoek van burgers bepaalde informatie te verstrekken, tenzij bepaald is dat die informatie niet voor publicatie geschikt is. Overheidsinformatie is op te vragen door middel van een WOB-verzoek en het indienen van zon verzoek wordt ook wel wobben genoemd. Bij het project van Sargasso werden twintig bereidwillige lezers ingezet om WOB-verzoeken in te dienen om een overzicht te krijgen van zoveel mogelijk beveiligingscameras in de openbare ruimte. De WOB-verzoeken waren voorgeschreven en de participerende lezers hoefden de verzoeken eigenlijk alleen maar op te sturen om ze vervolgens terug te sturen naar Sargasso. Toch ging dit ook niet altijd goed. Lezers lieten bijvoorbeeld termijnen verlopen en wilden soms de resultaten niet terug sturen naar Sargasso. Uiteindelijk moest Tokmetzis zelf dreigen met het inzetten van een advocaat om alle stukken terug te krijgen. 5.3.4 Bedrijven Sargasso heeft betere ervaringen met het samenwerken met bedrijven. Hier hebben de makers van Nederland van Boven ook veel ervaring mee. Zelfs bedrijven waarvan je het niet zouden verwachten waren bereid om mee te werken. Zoals Brinks, van het waardetransport. Maar ondanks dat dit bedrijf graag mee wilde werken aan een item over de routes van hun dienstautos liep dit op niets uit. Het bedrijf wist simpelweg niet hoe ze hun data uit hun programma konden krijgen. Ze hadden een tool die ze in hun internetbrowser gebruikten en konden wel een bitmap geven, maar verder niets. Waar die data precies te halen was, viel niet te traceren. Dus ze wilden wel, maar het lukte technisch niet, vertelt Jasper Koning. De redactie heeft met verschillende partijen onderhandeld over het vrijgeven van data. Soms met succes, andere keren zonder resultaat. Tomtom wilde hun data bijvoorbeeld niet delen. Tien jaar oude data zijn nog steeds een paar ton waard en we gaan dat niet aan jullie geven, zei de fabrikant van navigatiesystemen. Telecomgigant Vodafone wilde hun gegevens wel delen, maar wel onder strikte voorwaarde dat de data na gebruik vernietigd zou worden, dat de redactie het niet zou delen en dat het alleen voor de doeleinden van het televisieprogramma gebruikt zouden worden.

54

NERD MET VIJF POTEN

MASTERSCRIPTIE JAN KRUIDHOF

De vraag die zich opdringt, is in hoeverre je moet toegeven aan eisen of verzoeken van meewerkende partijen. Koning vertelt dat hij wel onderhandelde met de meewerkende partijen, maar dat is volgens hem niet anders dan normaal journalistiek werk. Dan zou je kunnen zeggen: Maak je je niet te afhankelijk van zon bedrijf? Nou, ik denk van niet. Wij hadden onze verhaallijn en wisten naar welke data we op zoek waren. Dat is het vertrekpunt geweest van waaruit we naar instanties zijn gegaan. Dit vindt ook Dimitri Tokmetzis. Hij merkt dat bedrijven soms graag meewerken, maar wel graag hun naam vermeld zien staan. Dat vinden ze bij Sargasso geen probleem. Dat is logisch, dat je de bron aangeeft. Als je ze alleen hoeft te noemen vind ik dat geen punt. Het volgens Dimitri niet meer dan normaal dat je de bron noemt, maar hij gaat geen reclame voor meewerkende bedrijven maken. Dat is gewoon een normaal journalistiek proces. 5.3.5 Obstakels bij samenwerking met bedrijven Maar ook als je geen haarbreed toegeeft aan de partijen van wie je data verkrijgt, ben je nog niet gevrijwaard van de mogelijkheid dat er gebruik van je wordt gemaakt. Dit vond Koning achteraf gezien de grootste uitdaging. Je moet wel geloven dat de data die zij jou leveren werkelijke data zijn. Daar houdt het wel ergens op. Koning probeerde wel te checken of de datasets die hij kreeg klopten. Om Vodafone als voorbeeld aan te houden. Dan heb je een dataset en daar staan op een gegeven moment getallen in. En die getallen zeggen: Het was dan en dan, daar en daar heel erg actief. Ik heb natuurlijk geen mogelijkheid om dit te checken. We hebben wel een redacteur aangenomen met expertise van geografische data, dus die kon in zoverre controleren: is dit een valide dataset, ziet dit er goed uit? Maar zeker weten doe je het nooit. Uiteindelijk was het verkrijgen van data niet zozeer moeilijk omdat bedrijven niet mee wilden werken, maar omdat het Commissariaat van de Media dwars ging ligggen. De VPRO mag als publieke omroep geen dingen van waarde aannemen. Koning: Het Commissariaat van de Media dacht gaandeweg het proces: Ja, maar die dataset die jullie hebben vertegenwoordigt een waarde. De makers waren het principieel met het commissariaat oneens. Als je een directeur van een bedrijf een lezing laat geven, kost dat geld, maar een interview is gratis. Zo kost een dataset normaal gesproken ook geld, maar als je die raadpleegt, is dat ook een soort interview, was hun redenatie. Voor de zekerheid heeft de redactie wel overeenkomsten moeten sluiten met meewerkende partijen, waarbij die in ieder geval afstand deden van de data. Dat was nog wel een heel juridisch traject erbij. Dus we hebben niet hoeven wobben, maar daarin hebben we nog wel een heleboel papierwerk te verstouwen gehad, wat nog even een projectje binnen het project werd. Maar wat betekent dit voor datajournalistiek bij de publieke omroep? Volgens Koning gaf

55

NERD MET VIJF POTEN

MASTERSCRIPTIE JAN KRUIDHOF

het commissariaat uiteindelijk wel toe, maar gezien de tijdsdruk konden ze geen uitzondering maken en schaarden ze zich aan de conservatieve kant. Maar de VPRO heeft de eerste horde genomen. 5.4 Organisatie Hoe ervaren Nederlandse datajournalisten de organisatie waarbinnen zij opereren? Begrijpen hun collegas de datajournalistieke projecten? Trekken leidinggevenden er geld voor uit? Dit is de ervaring van de genterviewde journalisten.

Bij twee nieuwsorganisaties worden datajournalistieke projecten bemoeilijkt omdat er door de leidinggevenden weinig tot geen geld voor vrij wordt gemaakt.

Bij drie van de onderzochte organisaties stappen collegas van de datajournalisten wel eens op hun af met een dataset. Bij drie organisaties gebeurt dit bijna nooit.101

Bij Nu is de geringe kolombreedte van de site een beperkende factor voor visualisaties.

De NOS is een grote organisatie. Dit heeft als voordeel dat er veel specialisten zijn, maar als nadeel dat de communicatie soms moeizaam verloopt en dat beslissing langzaam worden genomen.

5.4.1 Invloed van hoofdredactie Bij de NOS is internet first geworden, maar bij het NRC Handelsblad is men hier van teruggekomen. Tot ruim twee jaar geleden was de strategie nog om alles op het web te doen, maar dat is inmiddels veranderd. De site is nu voor snel nieuws en heeft een eigen redactie. Deze webredactie mag eigenlijk niet meer bezig met arbeidsintensieve achtergrondstukken, zoals de stembureau-uitslag op lokaal niveau. Daar is ook geen geld voor. De krant is gewoon het grootste verdienmodel, licht Laura Wismans toe. Arlen Poort begrijpt de nieuwe strategie, maar legt zich er niet bij neer. Ik had mij net aangeleerd in de jaren daarvoor hoe ik die geografische visualisaties moet doen, tja, dan ga ik het ook gewoon doen. Het is niet zo dat datajournalistiek zijn hobbyprojectje is, waar hij tegen de zin van de hoofdredacteur mee bezig is. Die ziet natuurlijk ook wel dat dit iets innovatiefs geeft aan NRC Handelsblad. Van: Hier werken mensen die wat kunnen. Of zoiets.
101

Bij Sargasso zijn maar twee vaste redacteuren en is van collegas niet echt sprake. Wel helpen vrijwilligers geregeld met datajournalistiek.

56

NERD MET VIJF POTEN

MASTERSCRIPTIE JAN KRUIDHOF

Ook bij de NOS is er geen geld voor datajournalistiek. Anke Vellenga heeft weleens met de hoofdredacteur gepraat. Dan wordt gezegd: Maar wat ga je dan doen? Wat voor nieuws ga je dan brengen? Ja, dat weet ik nu nog niet. De informatiespecialist denkt dat datajournalistiek niet zo hoog op het prioriteitenlijstje van haar leidinggevenden staat. En ik heb ook het idee dat ze het ook niet helemaal honderd procent begrijpen. Ze begrijpt overigens wel dat een leidinggevende niet zomaar geld uitgeeft aan een nieuwe technologie. Daarom doet ze het voorlopig in haar eigen tijd, net als Simon Rogers die bij The Guardian zonder budget begon en zijn chefs overtuigde met de resultaten die hij boekte. Maar het boeken van resultaten gaat moeilijk als je bijna geen middelen hebt, merkt Anke. Ik ga nu gewoon proberen aan te tonen wat we allemaal kunnen, maar dat is lastig als je er niet fulltime mee bezig kan. In februari 2013, een paar maanden na het interview, laat Vellenga weten dat de situatie enigszins veranderd is. De hoofdredactie lijkt inmiddels de meerwaarde van datajournalistiek in te zien en denkt er nu serieus over na. Andr Tak van RTL Nieuws heeft niet ervaren dat de hoofdredactie moeilijk te overtuigen was van het belang van datajournalistiek. Hij benadrukt het voordeel dat je op internet veel uit datajournalistiek kan halen en zodoende meer bezoekers op je site kunt krijgen. Maar hij begrijpt wel waardoor van hogerhand enigszins argwanend naar datajournalistiek gekeken kan worden. Kijk, als je constant maar je datajournalistieke methodes loopt te benadrukken, maar daar komt niets uit Dan kan ik me wel voorstellen dat mensen argwanend worden. Volgens Tak moet je niet teveel nadruk leggen op de datajournalistieke methode. Het doel is immers niet datajournalistiek, maar nieuws brengen. En dat daar nu net even andere methodes voor worden gehanteerd is volgens hem helemaal niet zo belangrijk. Ook dit doet overigens denken aan Simon Rogers, die na een optreden in Amsterdam stelde dat datajournalistiek over een paar jaar gewoon n van de vele gereedschappen uit de journalistieke toolbox zal vormen.102 5.4.2 Geen hulp van collegas Niet alle leidinggevenden zijn dus even makkelijk te overtuigen van het belang van datajournalistiek. Hoe zit dit met collegas die dichterbij de datajournalisten staan? Laura Wismans hoopt dat de bewustwording op de NRC-burelen groter wordt. Mensen komen natuurlijk best wel databestanden tegen, maar daar doen ze nooit wat mee. Ze hoopt dat collegas in gaan zien dat data waardevol kan zijn en het naar haar of Arlen doorsturen. Maar die stroom is nog niet echt op gang gekomen. Arlen heeft nog zijn best gedaan door een soort

102

Jerry Vermanen, Data journalism will be just journalism De Nieuwe Reporter (13-022012) http://www.denieuwereporter.nl/2012/02/data-journalism-will-be-just-journalism/.

57

NERD MET VIJF POTEN

MASTERSCRIPTIE JAN KRUIDHOF

masterclass datajournalistiek te geven aan zon vijftien mensen van de binnenlandredactie. Ik heb ze ook heel veel voorbeelden laten zien van bestanden die je als journalist tegen kunt komen, waar nieuws in zit, maar wat niemand in de gaten heeft, omdat ze niet weten wat ze ermee moeten. Ik heb echt geprobeerd om dat helemaal zo te doen zodat mensen daarna dachten: Goh, er is een rapport verschenen, maar misschien zit daar nog wel iets veel interessanters achter. Maar het komt niet echt. Wat niet meehelpt, is dat medewerkers van nrc.next, NRC.nl en NRC Handelsblad veel meer gescheiden van elkaar werken dan een paar jaar eerder. Poort legt uit dat de eigenaren van de organisaties zo beter kunnen zien of de afzonderlijke afdelingen rendabel zijn. Zo werkt dat bij alle bedrijven hoor, daar is niets raars aan en ik vind dat alleen maar goed. Je moet weten of dat wat je doet geld oplevert. Maar het nadeel is dus dat je niet meer van elkaars expertise kunt profiteren. Veel minder makkelijk. Aan de andere kant werken er ook weer een paar goede programmeurs bij het concern waar hij zonodig hulp van kan vragen. Bij Nederland van Boven verzorgden Jasper Koning en Frederik Ruys samen het leeuwendeel van de datajournalistiek. Ook bij RTL Nieuws gebeurt het niet zo vaak dat collegas naar de onderzoeksredactie komen met data die ze hebben gevonden. Andr Tak begrijpt dit wel. Het komt volgens hem doordat de rest van de redactie heel erg bezig is met het nieuws van de dag. Het is geen onwil, maar mensen letten daar niet op, omdat ze bezig zijn met het verslag doen van dagelijks nieuws. Dan kom je niet heel erg gauw in aanraking met data, stelt hij. Overigens is de rest van de redactie volgens hem wel positief over datajournalistiek. Het levert een nieuwsonderwerp op en extra clicks voor de website, dus iedereen is er wel enthousiast over. 5.4.3 Wel hulp van collegas Erik Bloem maakt wel vaak mee zijn collegas van Altijd Wat op hem af stappen. Kunnen we hier iets mee? En weet jij of hier ook data over te vinden zijn?, vragen ze dan. Anderzijds ervaart hij zijn functie wel een beetje als een eilandje. Ik zwem een beetje tussen de verslaggevers en de redacteurs. Ook de collegas van Jerry Vermanen bij Nu dragen redelijk vaak onderwerpen aan. Hij werkt vooral veel samen met de redacteur die schrijft over technologie en de redactrice die zich bezighoudt met economische onderwerpen. Maar op de dag van het interview heeft hij net een artikel gepubliceerd waarvoor hij heeft samengewerkt met de politiek verslaggever in Den Haag. En WOB-verzoeken maakt hij weer samen met Brenno Big Wobber de Winter. Anke Vellenga mag dan enige moeite hebben om haar leidinggevenden bij de NOS te overtuigen van het belang van datajournalistiek, maar ze krijgt van collegas op de vloer wel veel

58

NERD MET VIJF POTEN

MASTERSCRIPTIE JAN KRUIDHOF

positieve reacties op de datajournalistieke projecten. Zij zien volgens haar ook echt het nut in van datajournalistiek. Af en toe vraagt ze of collegas nog een leuk verhaal hebben. Ze denkt niet dat iedere collega het journalistiek aspect van data zou beseffen als hij of zij zelf op een databron zou stuiten. Maar meestal komen ze wel even naar haar toe als dat gebeurt. Ik heb iets met eh cijfers. 5.4.4 Omvang NOS voor- en nadeel Vellenga leidt bij de NOS een werkgroep datajournalistiek die bestaat uit ongeveer vijftien medewerkers van allerlei verschillende afdelingen, waaronder binnenland, buitenland, economie, NOS op 3, de internetredactie, nieuwe media en documentalisten. Het bij elkaar krijgen van al die mensen was lastig, omdat de NOS zon grote organisatie is. Maar een grote organisatie heeft ook als voordeel dat er veel specialisten rondlopen. Vellenga: De samenwerking tussen verschillende disciplines vind ik echt een voordeel. Dus dat je dan vanuit de redacteur inhoudelijk input krijgt. Wij hebben weer meer verstand van datasets en hoe je datasets kan vinden. Een grote organisatie vereist wel duidelijke communicatie. Zo verliep de totstandkoming van een van de projecten waar Vellenga uiteindelijk aardig trots op was een treemap103 van de rijksbegroting op Prinsjesdag enigszins moeizaam. De afdeling Economie had ook bedacht dat ze een visualisatie wilde die de begroting weergeeft en was naar NOS op 3 gegaan. Daar was een stagiaire vervolgens een dag bezig geweest om daar een visualisatie van te maken. Dus eigenlijk werd er op twee plekken binnen dezelfde organisatie dezelfde visualisatie gemaakt. Dat was een beetje dubbel. Ook kan er binnen de NOS niet snel besloten worden om bijvoorbeeld n persoon vrij te maken voor datajournalistiek. Het duurt een eeuwigheid voordat er een keer een beslissing wordt genomen. Want er moet overlegd worden en het moet allemaal strategisch en op beleidsniveau uitgewerkt worden. 5.4.5 Vormgeving Jerry Vermanen heeft bij Nu nooit financile beperkingen gehad. Het scheelt hierbij wel erg dat de meeste tools gratis zijn, geeft hij toe. Hij heeft wel een andere beperking, waar de andere organisaties minder last van hebben: de kolombreedte van Nu. Vergeleken met andere websites is die best wel smal, dus moet hij daar rekening mee houden als hij visualisaties maakt. Voor sommige visualisaties maakt hij een aparte pagina, bijvoorbeeld met het Europees
103

Een rechthoek bestaande uit kleine vierkanten die in grote corresponderen met bijvoorbeeld het budget van de ministeries die zij representeren.

59

NERD MET VIJF POTEN

MASTERSCRIPTIE JAN KRUIDHOF

Kampioenschap voetbal. Er was toen geen andere manier waarop de visualisatie kon worden weergegeven. Een pop-up is weer lastig in verband met advertenties en doorklikken. Dat is gewoon een beperking en daar moet je rekening mee houden. 5.4.6 Vrijwilligersorganisatie Sargasso is binnen de onderzochte groep een vreemde eet in de bijt. Het groepsblog is in principe een vrijwilligersorganisatie. Bovenaan staat de stichting, daaronder een kleine redactie en daaronder weer een flink reservoir aan vrijwilligers. Tokmetzis: Ik ben de baas van de site en moet aan het bestuur verantwoording afleggen. Het is volgens hem wel een lastig moment als in een vrijwilligersorganisatie opeens geld een rol speelt en professionele krachten komen die professionele eisen gaan stellen. Sargasso kreeg geld van het Stimuleringsfonds voor de Pers en werkt steeds meer voor professionele bedrijven. We zijn nu bezig met het ANP en Nieuwsuur. Dan loop je wel tegen de reputatie van een blog aan en gaan klanten op een blog kijken. Tokmetzis is eerlijk: wat op zijn site staat is niet altijd even goed. Het blijft schipperen: tot hoever ben je een professionele organisatie en tot hoever ben je een vrijwilligersorganisatie. 5.5 Medewerkers Voor dit onderzoek zijn tussen juni en november 2012 zeven journalisten genterviewd die zich intensief bezighouden met datajournalistiek. De een is dagelijks bezig met datajournalistiek, de ander publiceert misschien maar een paar keer per jaar een datajournalistieke publicatie. Wat ze gemeen hebben, is dat ze de journalistieke waarde van data zien. Hoe ze hier verder mee omgaan verschilt per persoon en nieuwsorganisatie. De journalisten zullen allereerst aan u voorgesteld worden. Vervolgens wordt geanalyseerd wat hun achtergrond is en wie volgens hen geschikt is voor datajournalistiek. Moet je daarvoor bijvoorbeeld kunnen programmeren? En wat is belangrijker: technisch of journalistiek inzicht?

Een goede datajournalist moet allereerst een goede journalist zijn, stellen twee van de meewerkende journalisten.

Datajournalistiek kun je het beste in een team bedrijven, is de overtuiging van vier genterviewden.

Technische kennis is niet noodzakelijk voor wie begint met datajournalistiek. Gewoon beginnen werkt het beste, merkten drie van de genterviewde journalisten. Het helpt wel als je gevoel hebt voor feiten checken, getallen, internet, techniek en internetapplicaties.

60

NERD MET VIJF POTEN

MASTERSCRIPTIE JAN KRUIDHOF

Aangezien maar weinig mensen op al die vlakken expert zijn, komt datajournalistiek het best tot stand in een team van verschillende experts die elkaar aanvullen, stellen drie genterviewden.

Een van de genterviewden kan al behoorlijk programmeren en vier journalisten zouden graag meer programmerkennis in huis halen of verwerven. Een van de genterviewden heeft nog geen behoefte aan een programmeur.

5.5.1 Niet echt datajournalist Niet iedereen die zich bezighoudt met datajournalistiek noemt zich ook een datajournalist. Anke Vellenga stelt wel dat zij bij de NOS degene is die het dichtst bij deze functie in de buurt komt, maar dat de NOS niet echt een datajournalist in dienst heeft: Er is niemand die dat fulltime doet. En Erik Bloem omschrijft zich op LinkedIn wel als datajournalist, maar ziet zichzelf eigenlijk niet zo. Hij noemt zich zo sinds hij op de vacature voor datajournalist bij Altijd Wat heeft gereageerd: Vervolgens heb ik binnen die vacature wel aangegeven dat ik niet alleen maar een datajournalist ben, maar liever als een algemeen onderzoeksjournalist beschouwd wil worden. Het verschilt per project hoeveel hij met datajournalistiek bezig is. Zijn eerste maanden bij Altijd Wat was hij fulltime bezig met data-analyses. Maar dat leverde naar mijn zin niet iets op waar we echt mee de bhne op konden, waar je echt iets mee ontdekt. Maar als een project geen datajournalistiek vereist, kan hij ook op een andere manier research doen en veel minder op data gericht zijn. Ik doe absoluut niet alleen datadingen. Jasper Koning geeft al voor het interview begonnen is een waarschuwing: Wij hebben niet aan datajournalistiek gedaan, wij hebben echt datavisualisatie gedaan. 5.5.2 Vereiste talenten Wat zijn belangrijke eigenschappen voor een datajournalist? Tokmetzis stel dat een journalistieke achtergrond belangrijk is. Als je een paar jaar in de journalistiek werkt, ontwikkel je volgens Tokmetzis een gut feeling voor wat nieuws is en wat niet. De verhalen die je maakt, daar is datajournalistiek gewoon stap n in. Wel een hele moeilijke stap, maar wat we daarna doen is altijd gewoon is nabellen, in context plaatsen, het normale journalistieke werk om er een verhaal van te maken. Dus je bent uiteindelijk toch bezig om een verhaal te vertellen. Andr Tak is het met hem eens. Het belangrijkste is dat [een datajournalist] gewoon een goede journalist is. Dat is echt het allerbelangrijkste. En je moet ook wat feeling hebben met getalletjes, dat ook. En je moet ook iets meer feeling dan gemiddeld hebben voor hoe je dat allemaal op internet zet. Maar als je geen goede journalist bent, dan val je heel snel door de

61

NERD MET VIJF POTEN

MASTERSCRIPTIE JAN KRUIDHOF

mand. Dan weet je bij God niet waar je informatie moet zoeken en dan weet je ook geen goede vragen te stellen. Dus dat is gewoon het allerbelangrijkste. Alle genterviewden hebben ook een journalistieke opleiding afgerond en/of bij een journalistieke organisatie gewerkt voordat ze met datajournalistiek aan de slag gingen. En technisch inzicht, is dat belangrijk? Arlen Poort kan behoorlijk aardig programmeren. Hij deed dat al een beetje op zijn vijftiende en leerde door de jaren heen verschillende programmeertalen, onder meer via NICAR. Vergeleken met de andere datajournalisten is hij technisch het meest onderlegd. Dimitri Tokmetzis en Laura Wismans waren daarentegen niet enorm technisch, toen ze bij Sargasso begonnen met datajournalistiek. We hebben het echt een beetje strompelend moeten leren, vertelt Tokmetzis. Volgens Erik Bloem heb je niet hele bijzondere talenten nodig om met datajournalistiek aan de slag te gaan. Je moet volgens hem gewoon beginnen. Maar, zegt hij, je moet wel dat feitelijke hebben. En gevoel voor cijfers is ook niet weg, zegt Andr Tak: Je moet ook wat feeling hebben met getalletjes. 5.5.3 Ideale team Het mooiste is als iemand n journalistieke kennis n technische kennis n grafische kennis heeft. Maar die combinatie is moeilijk te vinden in n persoon, denkt Anke Vellenga. Zij denkt daarom dat samenwerking uiteindelijk de beste oplossing is. Op de onderzoeksredactie van RTL Nieuws wordt datajournalistiek verricht door een team waarvan de leden elkaar aanvullen. Iedereen kan wel overweg met Excel, maar n persoon is daar uitzonderlijk goed in, terwijl anderen goed zijn in het bedenken van ideen en het opvragen van informatie. En er is ook nog iemand die er goed in is om dat allemaal op internet te krijgen, vertelt Tak. Dus er is niet n persoon die alles kan. We hebben dat een beetje verdeeld en iedereen heeft zijn eigen taak. Ook Dimitri Tokmetzis denkt dat datajournalistiek het best kan worden aangepakt door een team. Als je datajournalistiek goed wilt aanpakken op een grote redactie, heb je volgens hem twee mensen nodig: een journalist die techniek begrijpt en daarnaast een keiharde programmeur, die bijvoorbeeld kan scrapen en webvisualisaties kan bouwen. Hij vond het dan ook geen slimme zet van Altijd Wat om een datajournalist te zoeken. Ik zag die vacature en toen heb ik ook gezegd: Jullie zoeken de verkeerde persoon. Jullie moeten een programmeur hebben en niet een journalist, die hebben jullie zelf wel. Er lopen daar genoeg journalisten rond. Maar ja, ze hebben niet geluisterd. Het ideale team van Jasper Koning ziet er ongeveer hetzelfde uit, maar de televisiemaker ziet hier ook graag een vormgever bij.

62

NERD MET VIJF POTEN

MASTERSCRIPTIE JAN KRUIDHOF

Je hebt een journalistiek iemand nodig om een verhaal in die data te kunnen zien. Of dat nu een vernieuwend verhaal is of puur visualiserend, maar iemand moet naar dat verhaal kijken. Je hebt een grafisch iemand nodig die echt naar de vormgeving kijkt: hoe ziet dit eruit, hoe representeren we die data? En je hebt een technisch iemand nodig die de data kan bewerken, die erin kan rekenen, die er iets mee kan doen. Dus die drie kwaliteiten heb je altijd nodig. Dat is in een tv-redactie bijvoorbeeld niet altijd bij elkaar en in een digitaalafdeling ook niet altijd bij elkaar. Soms moesten we die techniek ook echt bij een gespecialiseerd bedrijf halen om bijvoorbeeld echt die treinen [in de visualisatie] over die spoorrails te krijgen, om die vliegbewegingen goed te krijgen. 5.5.4 Programmeerkennis Hoe zit het met de programmeertalenten van de genterviewde journalisten? Uit de gesprekken blijkt dat sowieso twee van hen graag beter willen kunnen programmeren. Laura Wismans zegt bijvoorbeeld dat ze hier vaak tegenaan loopt. Jerry Vermanen kan naar eigen zeggen een beetje programmeren. Een beetje copy-past-programmeren noemt hij het zelf. Beetje Frankensteincode maken. En dan werkt het soms en meestal niet en dan schakel ik weer hulp in. Vaak zoekt en vindt hij hulp op internet. Hij zou nog wel beter willen kunnen programmeren, maar weet anderzijds ook weer niet of hij dat ontzettend graag moet willen. Op een gegeven moment houdt het gewoon ergens op, dat ik er zoveel tijd in moet steken dat het niet meer efficint is om het door mij te laten doen. Dat het gewoon makkelijker is om hier iemand van techniek in te huren of iemand van buitenaf aan die klus te laten werken, die het dan in een halve dag of een ochtend heeft geregeld. Anke Vellenga zou graag iemand in de buurt hebben die goed kan programmeren. We hebben wel programmeurs bij Nieuwe Media natuurlijk, maar die werken meer op lange termijnprojecten. Die kunnen niet even snel ingezet worden voor een visualisatie die morgen af moet. Ook Dimitri Tokmetzis zou wel een programmeur willen bij Sargasso. Hij wil bijvoorbeeld veel meer databases koppelen. Van die echt grote databases en dan geautomatiseerd naar verbanden gaan zoeken. Nu is het toch vaak meer journalistiek gedreven, handmatig, op je guts kijken: waar kan nog wat zitten? Dat lukt ons met Excel nog niet. Hij heeft het idee dat ze nogal wat over het oog zien. Die gedachte werd bevestigd bij een hackathon, waar de financile posities van scholen werd bekeken. Wat zijn de reserves, afgezet tegen het leerlingenaantal en tegen het soort bestuur. Tokmetzis: Daar kwamen echt inzichten uit naar voren die je er anders gewoon niet uithaalt. (...) Een van de dingen die ze ontdekten was dat er

63

NERD MET VIJF POTEN

MASTERSCRIPTIE JAN KRUIDHOF

op Vlieland meer leerlingen ingeschreven stonden dan er kinderen van die leeftijd zijn. Dus daar is iets geks aan de hand. Volgens hem is dit het echte werk, waar de meerwaarde van datajournalistiek zich toont. We hebben nu eindelijk een beetje een workflow, dat het allemaal een beetje loopt, dus de volgende stap is om dat soort klussen te gaan doen. En zelf veel informatie binnen te slepen. Veel meer gaan scrapen. Maar programmeurs zijn duur. Die kosten zo 80 euro per uur. En journalisten zijn gewoon goedkoper. Niet iedereen heeft trouwens behoefte aan een programmeur. Erik Bloem zou nog geen concrete toepassing voor een programmeur weten. Daar is Dimitri veel verder mee. 5.6 Werkwijze Hoe pak je een datajournalistiek project aan? Waar begin je? Wat doe je met de data die je in handen krijgt? Welke afwegingen maak je bij de visualisatie? Hierover zeiden de genterviewde journalisten het volgende.

De journalisten herkennen zich wel in de workflows die in het theoretisch kader zijn beschreven, maar de stappen worden lang niet altijd netjes gevolgd.

Bij de NOS is de workflow het meest gestructureerd, omdat hier een grote groep mensen moet samenwerken.

De journalisten volgen niet altijd een vaste werkwijze, maar hebben ze wel routines voor onderdelen van hun werk.

Begin niet alleen met een vraag. Kijk ook of de benodigde data wel beschikbaar is. Anders breekt dit je later in het proces op.

Beginnen met data die er al is, is makkelijker dan beginnen met data die je nog moet zoeken of verzamelen.

Data verkrijgen betekent nog niet dat die bruikbaar is. Soms zijn bestanden onbruikbaar door hun bestandsformaat of doordat ze onvolledig zijn.

Twee datajournalisten hebben de indruk dat het verkrijgen van data bij officile instanties, wat soms best lastig is, langzamerhand makkelijker gaat.

Het Centraal Bureau voor de Statistiek (CBS) wordt door de meeste datajournalisten op de voet gevolgd. Veel berichten worden overgenomen. Een journalist vindt dat je hier wel mee moet uitkijken.

Journalisten verzamelen de data graag zelf, omdat dit unieke verhalen oplevert, maar dit kost ook veel tijd.

64

NERD MET VIJF POTEN

MASTERSCRIPTIE JAN KRUIDHOF

Sommige journalisten gebruiken de Wet Openbaarheid Bestuur (WOB) nooit. Bij Nu gebruiken ze de WOB, maar vaak pas als laatste redmiddel. En bij RTL wordt de WOB relatief snel ingezet.

Sommige journalisten scrapen nooit, anderen geregeld en bij de NRC wordt iedere week de website van Funda gescraped.

Twee journalisten vertelden dat ze bij het analyseren vaak vergelijkingen maken. Dit zou het ook goed doen in het nieuws.

Deskundigen kunnen een belangrijke rol spelen bij het analyseren van data. Het merendeel van de journalisten vindt het vooral belangrijk dat data niet te ingewikkeld worden gepresenteerd. Zij houden niet van ingewikkelde visualisaties.

Gratis tools kunnen erg handig zijn, maar uniformiteit in de presentatie is ook belangrijk, volgens de journalisten. Daarom laten ze soms speciale sjablonen ontwikkelen.

Visualiseren moet je wel consequent doen. Spreekt de visualisatie niet voor zich, dan kun je niet teveel bijkleuren. Dan wordt het een animatie.

5.6.1 Workflow Hebben de ondervraagde journalisten ook een vaste werkwijze voor hun datajournalistieke projecten? Dimitri Tokmetzis kan de standaardworkflow zo opdreunen: Je hebt vier basisstappen, die zijn bekend. Vinden, verwerken, opschonen, analyseren en visualiseren. Dat blijft gewoon. Daar zit je aan vast. Hoe dat precies gaat, dat ligt aan het onderwerp. Of je er nieuws uit wilt halen of achtergrond. Arlen Poort gelooft niet dat er een standaard workflow is. Laura Wismans stelt dat de stappen die in de standaardmodellen op zich wel kloppen, maar dat je niet alles altijd doet. Soms is data al schoon, wordt het gewoon schoon uit een database gedraaid. Nou, klaar is Kees. Maar globaal denk ik dat die stappen, bijvoorbeeld het stappenplan op de site van The Guardian, grotendeels wel kloppen. Vermanen vindt de workflowmodellen wel handig om aan iemand uit te leggen hoe hij ongeveer te werk gaat. Of voor academici, die zijn dol op modellen. Omdat je de werkelijkheid toch op een bepaalde manier moet uitleggen. Maar de modellen komen volgens hem niet helemaal overeen met de werkelijkheid. Het werkt wel zo in de praktijk, maar niet in dat vaste stramien. Maar dat geeft niet, zegt hij. Het maakt ook niet uit of de bedenker van dat model wel of niet echt denkt dat het zo gaat in de praktijk - het is gewoon een goed communicatiemiddel. Vaak zal het ook ongemerkt wel volgens zon model verlopen en dan sta ik er niet eens bij stil, waarschijnlijk.

65

NERD MET VIJF POTEN

MASTERSCRIPTIE JAN KRUIDHOF

Aan de andere kant kun je volgens Vermanen ook moeilijk oneens zijn met de modellen. Het zijn gewoon standaardschemas. Dat is bijna ieder journalistiek project zo: je verzamelt informatie, je verwerkt informatie, je presenteert informatie. En dat verwerken kun je dan weer in meerdere onderdelen opsplitsen, maar het komt in de basis op hetzelfde neer: ontvangen, verwerken, zenden. Tja, daar kun je het niet erg mee oneens zijn. Zo werkt het nu eenmaal. In werkelijkheid is een datajournalistiek project volgens Vermanen vaak een vloeibaar proces: het kan alle kanten op gaan. Frederik Ruys, de datajournalist van Nederland van Boven, visualiseerde zoals gezegd de workflow van zijn programma. De stappen waren achtereenvolgens: speuren, analyseren, combineren, visualiseren, schrijven en animeren. Volgens Jasper Koning is dit echt hoe de redactie te werk ging. Maar de workflow verschilde wel per dataset. Bij een fragment waarin een meeuw werd gevolgd die van een Waddeneiland naar Amsterdam vloog, was bijvoorbeeld niet veel research nodig en was de visualisatie redelijk straight forward. Maar voor een visualisatie van treindata waren veel meer berekeningen nodig en moest er veel data worden aangepast om de treinen daadwerkelijk over sporen te laten rijden en niet dwars door het land. Daar hebben we zelfs externe partijen bij gehad die meehielpen met rekenen. Er is zelfs processingkracht in India ingekocht om bij te processen. Tegen dat soort dingen loop je wel pas aan als je het probeert. Dus dat proces wisselt wel per omvang van de dataset. Vliegbewegingen zijn om soortgelijke redenen ook heel moeilijk. Hierbij heb je geen losse punten die een lijn vormen, maar bereken je het traject op basis van een aantal controlepunten. Zon dataset vereist ook veel bewerking en aanvulling. Bij RTL is een redelijk vast stappenplan, vertelt Andr Tak. Het begint met een idee. Vervolgens wordt gekeken of en hoe de benodigde gegevens te verkrijgen zijn. Wanneer de gegevens binnen zijn, wordt gekeken of die eenduidig is en of die aanvulling nodig heeft. Dan gaat diegene die in Excel gespecialiseerd is op basis van die gegevens die we hebben de meest interessante vragen stellen. Afhankelijk van de antwoorden wordt gekeken wat journalistiek gezien het meest interessante is. En op het internet kunnen we natuurlijk wat breder uitpakken. Interessante gegevens die niet meer in het televisie-item passen, kunnen online een plekje krijgen. 5.6.2 Meer structuur in workflow NOS Bij de NOS is meer sprake van een gestructureerde aanpak. Anke Vellenga overhandigt als enige een uitgeschreven stappenplan. Het document van anderhalf A4 beschrijft de volgende negen stappen.

66

NERD MET VIJF POTEN

MASTERSCRIPTIE JAN KRUIDHOF

1. Idee/dataset 2. Data verzamelen 3. Data opschonen 4. Analyse 5. Keuze visualisatie/tool Stappen bij externe/uitgebreide visualisatie a. Financiering b. Keuze voor externe datavisualisator c. Opmaken van briefing voor externe datavisualisator 6. Productiefase 7. Publicatie 8. Externe kanalen 9. Evaluatie Bij de NOS houden ze zich niet helemaal vast aan dit schema, vertelt Vellenga. Maar op zich gaat het meestal wel zo. De informatiespecialist heeft zelf wel een verklaring voor het feit dat de werkwijze van haar organisatie een stuk gestructureerder is dan die van andere nieuwsorganisaties. Die andere zijn echt datajournalist en die zijn in hun eentje of samen met een programmeur. En bij ons is het echt een samenwerkingsproces over de hele redactie. En wij hebben eigenlijk geen datajournalist en ook geen programmeur. Dan moet je dat toch zo een beetje oplossen. Het stappenplan moet overigens nog wel een beetje aangescherpt worden, zegt ze. De eerste stap is: je gaat naar Documedia en redactie en media gaan overleggen over een visualisatie of idee. Een dag voor het gesprek heeft iemand van de economieredactie die stap overgeslagen. Die is gelijk naar NOS op 3 gegaan. Uiteindelijk werd toen op twee plekken binnen de NOS afzonderlijk aan twee vrijwel identieke visualisaties gewerkt. Dus het moet nog wel misschien beter duidelijk gemaakt worden. 5.6.3 Routines Hoewel niet iedereen strikte workflows volgt, zijn er wel bepaalde routines te herkennen bij de datajournalistieke projecten van de genterviewde journalisten. Bij Sargasso hebben ze drie verschillende ritmes korte periodes voor dagelijks nieuws en langere periodes voor achtergrondverhalen. Het eerste is echt het hele korte nieuws. We hebben met ANP afgesproken

67

NERD MET VIJF POTEN

MASTERSCRIPTIE JAN KRUIDHOF

dat we in principe dagelijks een nieuwtje afleveren, een cijfernieuwtje. En n keer in de week probeer je een wat groter verhaal te maken, met wat meer body. Ofwel bijzondere data die nog niemand heeft, die we hebben gewobt soms of via ministeries hebben gekregen of via anderen, via niet zomaar openbaar gemaakte stukken. Dat is het tweede ritme. Daarnaast hebben we echt de grote projecten die hackathons bijvoorbeeld, waar we echt de diepte in willen gaan en daar een hele serie verhalen uit willen krijgen. Dus eigenlijk drie niveaus heb je. Lekker snel, wat meer achtergrondverhalen en de echt diepgaande stukken. Tokmetzis noemt een voorbeeld van lekker snel: Wat we gisteren hadden bijvoorbeeld, over treinen die rode seinen negeren, daar is onderzoek naar geweest, helemaal weggestopt in een rapportje. Dat rapportje heette ook STS Passages 2011, geen hond die dat leest natuurlijk, behalve ik dan. Daar bleek gewoon nieuws in te zetten: dat het aantal treinen dat door rood rijdt enorm is gedaald. Ik haal die data eruit, zet het even netjes op een rij, maak een basale analyse, dat gaat dan vervolgens naar ANP, die zet er een journalist op, die gaat dan rondbellen en je hebt nieuws, in vrij korte tijd. Is dat datajournalistiek? Ik denk het niet, maar wij zitten inmiddels zo goed in die datastroom. Rapporten die op het eerste oog oninteressant zijn hebben sowieso Tokmetzis voorkeur. Ik bekijk altijd eerst de rapporten met de meest saaie naam, daar zitten vaak interessante dingen in. Als hij zon rapport in handen krijgt, neemt hij het op geroutineerde wijze door. Je leest eerst even de inleiding en samenvatting door, bekijkt even de methodologie: hoe zijn die cijfers tot stand gekomen. Vervolgens scroll ik vrijwel meteen door naar de tabellen. De cijfers moeten het verhaal al vertellen. Poort heeft ook bepaalde routines. Als hij een bestand krijgt opent hij dat zo mogelijk in Excel. Wat hij dan als eerste doet, is uitzoomen. Dat kan h, dat je het werkblad op tien procent zet. Dan zie je niet meer wat er staat, maar dan zie je wel een tabel. En als dat er visueel raar uitziet, dan zoom ik in op de rare plekken en kijk ik: is daar iets verkeerd gegaan met het importproces? Alsof je de tabel uitprint en vijfentwintig meter verderop gaat staan en dan kijk je: Is dat nu een mooi patroontje? Visualisaties, die in de workflows pas aan het eind van het traject aan bod komen, maakt Poort ook wel eens tijdens de analysefase. Je kunt ook puntenwolken maken bijvoorbeeld. Stel: je vraagt je af of er een verband is tussen de lengte van een hardloper en hoe snel hij aan de finish is. Als je daar de gegevens van hebt, dan maak je daar eerst een puntenwolkje van. Als dat een mooi wolkje is, wat een beetje bij elkaar zit, dan heb je een verhaal. Als het allemaal in een cirkel staat: laat maar gaan, daar hoef je niet eens verder naar te kijken. De werkdagen van Vermanen vertonen ook een bepaalde vorm van routine. Hij beschrijft zijn globale werkdag: Ik kom hier s ochtends aan, ik weet dat om half tien de CBS-cijfers er zullen

68

NERD MET VIJF POTEN

MASTERSCRIPTIE JAN KRUIDHOF

zijn, dus daar probeer ik al tijd voor vrij te maken, dat zijn gewoon vaste dingen en er komen altijd goede visualisaties uit. Maar dat is eigenlijk de vastigheid die ik heb, van de CBS-cijfers. Tussendoor en ook van tevoren op Nu kijken. We hebben nu weekvergaderingen, dus we weten ook welke onderwerpen er in de loop van de week aankomen, dus die kun je ook al een beetje vooruit plannen. En: die collega is daarmee bezig, kan daar data in zitten? Bij het maken van visualisaties valt hij vaak terug op standaardvormen. Aan de ene kant omdat dat sneller werkt een lijngrafiek, een staafdiagram of soms een kaartje, dat is vrij makkelijk te bepalen wanneer je wat moet inzetten. En het is voor lezers ook heel goed herkenbaar. 5.6.4 Het begin Hoe kom je op ideen voor een datajournalistiek project? Voor de een is dat makkelijker dan voor de ander. Sommige genterviewden zien bij het vinden van een dataset direct een journalistiek verhaal voor zich. Zo vertelt Arlen Poort dat hij sinds kort weet van het bestaan van de Nationale Databank Weggegevens. Mensen denken dan al snel aan file-informatie, maar Arlen legt uit dat hij zulke info eerder wil gebruiken voor economische vraagstukken. Zijn bepaalde gebieden minder populair bij automobilisten? Wat zegt dit over de economie? Normaal stond het altijd vast bij de Beneluxtunnel en toen de crisis begon kon je daar ineens doorrijden. Komt dat nu doordat er net een paar minder vrachtwagens rijden waardoor het verkeer doorstroomt? Kortom: hij legt veel koppelingen tussen verkeersdata en allerlei andere onderwerpen. Sommige mensen, zoals Bas Broekhuizen, stellen dat je bij datajournalistiek met een vraag moet beginnen. Dimitri Tokmetzis doet dit inmiddels juist niet meer. Hij baseert zich op zijn eigen ervaring: Wij begonnen in het begin ook vaak met een vraag om er vervolgens achter te komen dat de benodigde data niet bestond of niet te krijgen was. Dan is al je moeite voor niets. Vragen zijn heel belangrijk, natuurlijk. Je moet altijd vragen stellen. Soms is het ook allebei een beetje. Maar je moet wel weten dat de data er zijn. Andr Tak herkent wel wat Tokmetzis zegt. Maar hem zou zoiets nooit overkomen. Ik snap het wel. Maar dan heb je in het begin niet goed gekeken of de data wel beschikbaar is en waar. Je moet je dat echt heel erg goed realiseren in het begin. Je kunt allerlei interessante vragen bedenken, maar of het allemaal beschikbaar is, dat is net de grote valkuil. Meestal is het namelijk niet beschikbaar of niet alles. Bij RTL kan men zich sowieso niet veroorloven om een project na een paar weken te moeten afblazen. Als wij met een project beginnen, dan zal het lukken ook. Wij krijgen die gegevens dan ook. Gegevens niet krijgen is geen optie.

69

NERD MET VIJF POTEN

MASTERSCRIPTIE JAN KRUIDHOF

Hoe beginnen Tak en zijn collegas dan met een project? Hoe komen zij bijvoorbeeld op ideen? Daarover wil hij weinig kwijt. Dat is een goede vraag. Daar ga ik niet alles over vertellen. Tak beperkt zich ertoe te zeggen dat je in zijn algemeenheid na kunt denken over wat mensen interessant zouden kunnen vinden als ze op een bepaalde plek wonen. Later zegt hij: Je moet vanuit de andere kant denken. Waarvan je denkt dat er gegevens zijn. En hoe ze opgeslagen worden. En daar een vraag bij stellen die interessant is. Maar als je gewoon out of the blue vragen gaat stellen die je interessant vindt, dan is het maar de vraag of die gegevens op die manier bij andere partijen voor handen zijn. Dus je moet het een beetje van de andere kant benaderen en je afvragen waarom organisaties bepaalde gegevens bijhouden, met welk doel, en dan kijken of wij er wat aan zouden kunnen hebben. Je moet je een beetje verplaatsen in de andere organisatie. Dit lijkt een beetje op wat Dimitri Tokmetzis adviseerde. Als je het jezelf makkelijk wilt maken, begin je met de data die er al zijn. Erik Bloem zegt ook dat je zou kunnen beginnen met het opvragen van data. Hij is ten tijde van het interview bijvoorbeeld bezig met het onderwerp energie. Hij weet dat Nederlanders veel energie verbruiken per hoofd van de bevolking. Bloem doet vervolgens het volgende: hij gaat naar de site van de Wereldbank, waar een database is van het energieverbruik per hoofd van de bevolking van veel landen. En dan ga je kijken hoe dat voor Nederland zit, je gaat vergelijken met andere landen. Vervolgens kijkt hij of er nog iets met de dataset moet gebeuren of dat dit gegeven an sich voldoende is om een rol in het verhaal te spelen. Vergelijken is sowieso iets wat veel gebeurt in datajournalistiek, maar daarover later meer. Bij Altijd Wat wordt naast de gebruikelijke methoden gewerkt met een zogenaamde ideenfabriek. Het zijn twee mensen die een beetje innovatieve ideen proberen op televisie te krijgen. En daar brainstormen we dan mee over bepaalde domeinen waarbinnen wij onderwerpen willen maken. Brainstormen werkt ook goed voor Arlen Poort: De beste ideen krijg ik in ieder geval als ik met anderen praat. Jerry Vermanen vertelt dat bij Nu de eerste stap is, dat er gekeken wordt of er achter een (pers)bericht getallen schuilen die te visualiseren zijn. Vermanen: En je afvragen: Waar zijn die getallen op gebaseerd? Kunnen we een Excel-sheet krijgen? 5.6.5 Verkrijgen van data lastig? Stel, je hebt een idee. Wat dan? Andr Tak vertelt dat je jezelf dan allerlei dingen moet afvragen. Waar zijn de benodigde gegevens? Zijn ze berhaupt beschikbaar? Welke methode moet je

70

NERD MET VIJF POTEN

MASTERSCRIPTIE JAN KRUIDHOF

hanteren om de data te verkrijgen? Gewoon n telefoontje en vragen? Of moeten we daarvoor een WOB-procedure starten? Of moeten we iets anders doen? Zelf data verzamelen kan best lastig zijn. Jerry Vermanen weet dit uit ervaring. Data verzamelen en daar zelf nieuws uithalen dat is nu nog wel een echte uitdaging. De overheid wil volgens hem niet altijd meewerken wanneer er grote hoeveelheden informatie worden aangevraagd. Of je krijgt informatie en komt erachter dat die niet goed is bijgehouden of dat je er gewoon geen goede conclusie uit kunt trekken omdat je er zoveel kanttekeningen bij kunt plaatsen. Arlen Poort kreeg bijvoorbeeld wel eens gescande tabellen toegestuurd door gemeentes. Het kost zoveel tijd om zoiets om te zetten naar bruikbare bestanden, dat het bijna niet de moeite waard is. Veel gemeentes hebben veel interessante gegevens, maar het is vaak lastig hen te bereiken. Laura Wismans: Alle gemeentes hebben niet eens een eenduidig e-mailadres waarop je ze kunt bereiken. Politiekorpsen zijn makkelijker te bereiken, maar veel verschillende korpsen houden hun data op verschillende manieren bij. Zo kun je dus helemaal nooit iets met politiecijfers doen, want ze zijn niet met elkaar te vergelijken, vertelt Wismans. Dat is echt wel waardoor projecten mislukken. Gelukkig lijken grote instanties langzamerhand makkelijker data te verstrekken. Jerry heeft bijvoorbeeld de indruk dat ambtenaren beter bekend raken met data en steeds beter weten waar de gevraagde data zich bevindt. Laura Wismans merkt ook dat er beweging is op dit vlak: Er wordt over gesproken. [] Ze worden minder bang. Het wordt niet alleen maar gezien als supernegatief of ze willen ons er alleen maar mee aanvallen. 5.6.6 CBS Een makkelijke manier om aan data te komen, is het volgen van het Centraal Bureau voor de Statistiek (CBS). Dat doen de meeste datajournalisten dan ook trouw. Volgens Poort is het CBS een van de belangrijkste bronnen. Hij is zelf geabonneerd op alle RSS-feeds die het bureau aanbiedt: Dat zijn denk ik vijftien berichten per dag. Maar het meeste gaat over economische onderwerpen die heel erg gaan over een bepaalde sector. Dan denk je: Zal wel. Maar zo zie je wel alles wat het CBS elke dag publiceert. Ook bij Sargasso volgen ze het CBS op de voet. Wat we vaak doen, is 's ochtends even rondje langs het CBS. Niet om te kijken naar de persberichten, maar welke tabellen zijn er gepdatet. Daar zitten vaak nieuwe cijfers in, dus dat kan nieuws aanleveren en dat is waar veel journalisten niet in kijken. Jerry Vermanen houdt het CBS ook scherp in de gaten. Het bureau bepaalt deels zijn agenda. Op vrijdag krijgen we de CBS-agenda. Daar staan alle onderwerpen voor de volgende week in.

71

NERD MET VIJF POTEN

MASTERSCRIPTIE JAN KRUIDHOF

CBS-cijfers worden elke dag om half tien s ochtends bekend. Dan is het vrij makkelijk om vrij te plannen. Je weet welk onderwerp op donderdag om half tien gaat langskomen. Soms is een grafiek eerder klaar dan dat het bericht is getikt. Dan ben je het een beetje voor. Zodra het bericht online gaat kun je gelijk de grafiek er inknallen en ben je er als eerste mee. Vermanen is wel blij met het CBS. Het handige bij het CBS is vooral dat de statistici die daar werken ook vaak wel de juiste nieuwsinsteek zien. Die pakken het belangrijkste er ook vaak als wel zelf uit. Dan kunnen wij heel geforceerd een andere insteek kiezen. Soms werkt het wel als je extra informatie zoekt in zon dataset en dan komt het een alinea eronder te staan, maar de hoofdmoot van het bericht blijft vaak wel hetzelfde. Moet je daar niet een beetje mee oppasen? Vermanen: Het is een onafhankelijk instituut dus wat dat betreft hebben ze er niet echt belang bij om dingen te verhullen. [] Je merkt gewoon dat onderzoekers bij het CBS er heel voorzichtig mee zijn om conclusies te trekken die niet kloppen. Als ik iets tegenkom wat niet klopt en ik bel naar het CBS wordt dat ook direct aangepast op de site. Maar de hoofdmoot van de berichten blijft eigenlijk wel altijd hetzelfde. Ik controleer het natuurlijk wel gewoon altijd als ik een dataset krijg, van, kan ik dezelfde conclusie eruit trekken of kan ik er misschien andere conclusies uit trekken. Erik Bloem houdt het CBS niet in de gaten. Wel neust hij regelmatig in databases als Statline en Eurostat, maar dat is pas op het moment dat ik denk dat daar iets is wat ik nodig heb. De CBS-statistiek is volgens hem ook beter geschikt voor internetsites als Nu dan voor een televisieprogramma. Hij [Jerry Vermanen] maakt daar iets moois en inzichtelijks van. En in die zin is het heel anders. Daar kun je op televisie natuurlijk ook niet zoveel mee. Op televisie is het nog niet een halve minuut zendtijd als je laat zien waar alle spelers vandaan komen [op het WK, wat Vermanen liet zien in een visualisatie die zelfs door The Guardian werd opgepikt]. De NCRV-journalist vindt het wel riskant dat het CBS zon grote invloed heeft op de datajournalistiek agenda. Dat is in ieder geval journalistiek gevaarlijk. Doordat er minder mensen op de nieuwsredacties werken komt een KPMG-rapport over het vestigingsklimaat in verschillende Nederlandse gemeenten gewoon rechtstreeks de krantenpaginas op. Terwijl ik denk: Waarom? Hoe kan een KPMG-rapport nou nieuws zijn? Want je kunt helemaal niet achterhalen hoe ze onderzoek gedaan hebben. [] Je moet er wel mee uitkijken, vind ik. 5.6.8 Zelf data verzamelen Erik Bloem merkt op dat datajournalistiek nu heel erg gaat over bestaande datasets. In zijn tijd bij de Volkskrant maakten hij en zijn collegas zelf een dataset, bijvoorbeeld over de strafmaten in Nederland of over invloedrijke bestuurders. Dit kost tijd, maar heeft ook een belangrijk voordeel, vertelt Bloem: Als je zelf een dataset maakt, dan heb je een dataset die niemand

72

NERD MET VIJF POTEN

MASTERSCRIPTIE JAN KRUIDHOF

anders heeft en daar kun je dan ook op voortborduren. Dimitri Tokmetzis geeft toe dat zelf data verzamelen het meest bewerkelijk is, maar noemt het ook het leukste. Sargasso wobte bijvoorbeeld alle gemeentes om hun cameraposities. Dat is vreselijk veel werk, maar dat levert wel heel veel op. Door een datajournalistieke benadering te kiezen, word je volgens Tokmetzis gedwongen data te zoeken die nog niet wordt gebruikt. En een van de dingen die wij vonden is dat het UWV gewoon maandelijks werkloosheidscijfers per postcode bijhoudt. Die cijfers worden nauwelijks tot niet door andere media gebruikt, terwijl je daar wel heel interessant nieuws uit kan halen. Laura Wismans geniet er het meest van als ze data op een spectaculaire manier heeft verkregen: Hoe explosiever hoe beter. Open data zijn in haar ogen heel leuk en heel goed, maar brengt ook met zich mee dat alle andere journalisten het ook kunnen hebben. Dan ben je bijvoorbeeld heel lang met iets bezig en dan heeft iemand anders het ook al. Laura: Ik vind het het leukste als je een dataset hebt waarvan anderen zeggen: Goh, wat leuk dat ze die heeft losgekregen. 5.6.9 Data verkrijgen via WOB Maar hoe kom je dan aan originele data? Het is niet zo dat die spontaan naar de redactie wordt gestuurd door een mysterieuze Deep Throat, vertellen de medewerkers van RTL en Nu. Het is eigenlijk bijna nooit zo dat er data binnenkomt, zegt Jerry Vermanen. Je zult dus zelf achter je data aan moeten. Een manier om databestanden te verkrijgen is om te wobben. Niet iedereen maakt gebruik van deze optie. Poort heeft de WOB bijvoorbeeld nog maar twee keer gebruikt en beide keren zonder succes. Een keer wobte hij uit ergernis, omdat Rijkswaterstaat een bestand voor veel geld verkocht terwijl het overheidsinformatie was. Ze hadden toen niet gereageerd op mijn WOB-verzoek en omdat het niet een deel van mijn workflow was om daarmee door te gaan is het mij ontschoten. Een andere keer wilde hij de geboortedatum, sekse en het woonadres van kandidaten voor de gemeenteraadsverkiezingen. Deze informatie moest stuk voor stuk opgevraagd worden bij honderden gemeenten. In de paar maanden tijd die hij had was dit een onbegonnen zaak. De WOB wordt ook regelmatig gebruikt bij Nu. Maar het is wel een lastige procedure, zegt Vermanen. Bovendien is hij voorzichtig met wobben. Je hebt journalisten die al voor elk wissewasje dreigen met een WOB-verzoek, wat helemaal niet handig is, want soms is een telefoontje naar een woordvoerder of iets dergelijks veel makkelijker en veel sneller. Voor een WOB-verzoek moet je het sowieso eerst op andere manieren proberen te regelen. Vaak is dat voor jezelf ook sneller en voor de overheid minder belastend. Omdat een WOB-verzoek een hele

73

NERD MET VIJF POTEN

MASTERSCRIPTIE JAN KRUIDHOF

procedure is die je dan op gang zet kost het ook daar heel veel tijd en mankracht. Een telefoontje naar persoon kan ook heel veel bewerkstelligen. En vaak helpt het ook vaak om aan de telefoon te zeggen: Ik bel nu, ik weet dat ik u ook kan wobben, dat jullie die informatie hebben. Maar voordat we dat gaan doen.. Ik vraag het nu gewoon even zo aan. Dat scheelt mij heel veel tijd, scheelt jullie heel veel tijd. Een andere reden dat Vermanen niet zomaar gaat wobben, is dat het erg lang duurt. Dat is gewoon klote, dat dit zo lang duurt en dat je dan exact alles moet verwoorden omdat je anders toch ergens tussen de letters door wordt genaaid. Dat is niet leuk. Dus probeer je dat gewoon te vermijden, maar dat is wel iets wat je in je achterhoofd houdt van: dit is ons ultieme middel om in te zetten. Op de RTL-redactie wordt de WOB veel sneller ingezet. Eerst gewoon vragen om de data doet de redactie niet. Nee, [wobben] doen wij vanaf het begin af aan. Kijk, als je dreigt met een WOB-verzoek en er komt nooit een WOB-verzoek, dan is het dreigement waardeloos. 5.6.10 Data verkrijgen door scrapen Achter sommige websites, zoals Funda, schuilen grote databases. Met bepaalde software is het mogelijk om de inhoud van die databases te hergebruiken. Zo kun je er zelf bijvoorbeeld onderzoek naar doen. Ook Arlen Poort scrapet geregeld, zoals al eerder werd beschreven. Funda scrapet hij nu nog iedere week. En ik heb diverse keren de Overheidsalmanak gescraped, gewoon om te weten welke burgemeester bij welke gemeente zat. En dat ging dan om zijn partij. Die gegevens waren wel ook op een andere manier beschikbaar, maar het was uiteindelijk makkelijker als ik heel snel een scriptje schreef waarmee ik dat van die website haalde Vermanen heeft ook een paar keer gescraped. Gewoon op de simpele manier: gewoon een plug-in in je browser installeren dat je HTML-tabellen makkelijk in een keer in Excel kun importeren. Net als bij het wobben werkt ook hier een telefoontje soms sneller. Ik heb dat n keer gedaan en toen dacht ik van: misschien is het gewoon handig als ik even een mailtje stuur naar die persoon met de vraag of ik het mag hebben. Er stond geen exporteerknop ofzo, dus ik dacht: dit moet ik scrapen. Nou, gewoon even mailen en die persoon is hier geweest en we hebben koffie gedronken en hij had die informatie gewoon op een USB-stick staan. Net zo makkelijk. Erik Bloem kan niet scrapen. Hij geeft toe dat dit bij een eerder onderzoek naar de strafmaat in Nederland wel handig was geweest. Wij wilden weten of er een ontwikkeling was in de strafmaat. De directe aanleiding was natuurlijk de minimumstraffendiscussie. En wat blijkt dus: rechters luisteren al naar de roep vanuit de samenleving om zwaarder te straffen. Ik heb gewoon al die tekstbestandjes [met gerechtelijke uitspraken] geopend en dan weet je gauw

74

NERD MET VIJF POTEN

MASTERSCRIPTIE JAN KRUIDHOF

genoeg waar ongeveer de strafmaat staat. Dat is vrij analoog, beetje oude techniek. Dimitri had dan waarschijnlijk een of andere automatische scraper gemaakt die het allemaal in een database stopte. Dat heb ik niet gedaan. Ook Anke Vellenga kan niet scrapen, al zou ze dat wel graag willen kunnen. Dat wil ik wel leren, maar er is niemand die dat eigenlijk kan. Ook een gemis. Dat zou een programmeur wel even voor je kunnen doen. Andr Tak is nog een beetje huiverig voor scrapen. Bij scrapen kom je er toch dan weer achter dat het weer niet vergelijkbaar is. Of dat je echt een ratjetoe binnenhaalt. Het moet wel precies zijn he. Scrapen is ook weer een aparte techniek. Ik heb het idee dat dit nog te vroeg is op dit moment. Misschien komt dat later. Gegevens moeten wel betrouwbaar zijn. We maken er uiteindelijk een nieuwsitem van. En als we dan hebben zitten scrapen en maar wat dingen hebben binnengehaald.. Het moet wel kloppen. 5.6.11 Checken en opschonen Als je eindelijk data binnen hebt, moet je nog wel checken of het klopt. Tokmetzis is inmiddels erg sceptisch. Betrouwbaarheid is een groot probleem. Ik doe dit nu ruim een jaar en ik moet zeggen: ik vertrouw geen enkele cijfers meer. We vinden altijd fouten in cijfers. Ook wordt gekeken of de informatie bruikbaar is. Tak: Is dat allemaal eenduidig aangeleverd of afwisselend? Moeten er dan bijvoorbeeld nog extra gegevens opgevraagd worden om het allemaal gelijk te krijgen? Vaak moet de data eerst geordend worden. Dat doet Vellenga ook als eerste. Eerst proberen een beetje te begrijpen: wat is het, wat staat er allemaal in? Voor het importeren en analyseren van grote datasets maakt ze gebruik van het programma LQD (uitgesproken als liquid). Dus je kunt het opschonen, ordenen, structureren. En dan kun je dus makkelijk gegevens eruit halen. Het belang van goed gestructureerde data moet niet onderschat worden, waarschuwt Tokmetzis. Daar kom je later ook wel achter hoor, dat die dataverwerking zo ontzettend belangrijk is. Dat je het goed neerzet. Dat je stappen kunt herleiden. Dat als je ergens een fout maakt, dat je die fout kan herstellen zonder dat je al die stappen daarna opnieuw moet doen. Dat is wel prettig. Dus je moet Excel zo gebruiken dat als je ergens wat verandert, dat die analyse verandert. En die kaarten veranderen. Bij Nederland van Boven kostte het behoorlijk veel tijd om de data eenduidig te krijgen. Alle verschillende varianten van tijds- en locatienotatie moesten eerst op n lijn gezet worden, voordat er iets met de data kon worden gedaan. Pas daarna kon Koning verder met stap twee: analyseren. Dan zaten we acht uur lang naar data te kijken: is er een patroon te zien?

75

NERD MET VIJF POTEN

MASTERSCRIPTIE JAN KRUIDHOF

5.6.12 Data bevragen Zodra de data gecheckt is en bruikbaar is gemaakt, kun je gaan kijken op welke vragen de dataset antwoord geeft. Tak: Dan gaat diegene die in Excel gespecialiseerd is op basis van die gegevens die we hebben de meest interessante vragen stellen. Afhankelijk van de antwoorden wordt gekeken wat journalistiek gezien het meest interessante is en wat de kop van het verhaal kan worden voor het tv-item. Interessante gegevens die niet meer in het tv-item passen, kan de redactie op internet kwijt. Een redelijk eenvoudig begin van het bevragen is vergelijken. Je pakt de gegevens over fenomeen X in Nederland en legt dit naast de data van andere landen. Of je neemt de data over verschijnsel Y bij mannen en kijkt hoe dit is bij vrouwen. Bloem vertelde dat hij ten tijde van het gesprek onderzoek deed naar energieverbruik. Nederland gebruikt erg veel energie per hoofd van de bevolking. Dan ga je naar de Wereldbank toe en die hebben en een database van het energieverbruik per hoofd van de bevolking van ontzettend veel landen. En dan ga je kijken hoe dat voor Nederland zit, je gaat vergelijken met andere landen. Dan ga je kijken of je met die dataset iets moet of dat je aan dat gegeven an sich genoeg hebt om in dit geval een rol te spelen in je verhaal. Voor het verhaal over energieverbruik waren de gegevens voldoende. Volgens mij is het genoeg dat ik gewoon kan zeggen dat Nederlanders enorm veel energie verbruiken. Veel meer dan het gemiddelde van Europa, ten opzichte van Duitsland, enzovoort. Tokmetzis ervaring is ook dat vergelijkingen goed aanslaan. Je weet gewoon: wat het goed doet in het nieuws is een vergelijking van Nederland met andere landen, Belgi ofzo. Vaak heb je gewoon een rijtje met cijfers van de Europese Unie, maar zet het gewoon eens af tegen bevolkingsomvang. Dan krijg je vaak hele andere inzichten: Eigenlijk doen we het best goed of Eigenlijk doen we het helemaal niet zo goed. Soms kom je er pas na het checken en opschonen van de data achter, dat de data toch geen antwoord bieden op jouw vragen. Dat overkwam Vellenga bij de analyse van een dataset met alle wapenvergunningen in Nederland. We hebben dat geanalyseerd en gekeken: Wat kunnen we hier nu uithalen voor nieuws? Dat bleek nog best lastig te zijn. Toen hebben we er zelfs ook nog deskundigen bij gehaald. Wat ook een belangrijk onderdeel is, denk ik wel, van datajournalistiek. Dat staat hier niet in het werkproces, maar dat is wel zo denk ik. Maar die [deskundigen] zeiden: Eigenlijk zit hier ook helemaal geen nieuws in. Want wij wilden weten hoeveel automatische en semi-automatische wapens zijn er nou in omloop in Nederland. Maar dat viel niet uit die dataset te halen. Het beste is om al die wapens in het echt te bekijken, maar dat is natuurlijk niet mogelijk. En het type en kaliber en merk stond er wel bij, maar daar kun je

76

NERD MET VIJF POTEN

MASTERSCRIPTIE JAN KRUIDHOF

niet uit ophalen of ze semi-automatisch zijn. Want ze kunnen verbouwd worden. Ze vergeleken dat met Volkswagen Polo, dan heb je ook verschillende varianten weer en dat heb je ook met wapens. Dus dat was een beetje jammer. Maar op zich was het wel een keertje echt datajournalistiek. Uiteindelijk kon de data nog wel gekoppeld worden aan een gerelateerd verhaal over de schietpartij in Alphen aan de Rijn. 5.6.13 Presenteren Uiteindelijk wil je als journalist maar n ding met data: het verhaal zo goed mogelijk presenteren aan je publiek. Maar wat is een goede manier? Vier van de genterviewde journalisten geven aan dat n ding erg belangrijk voor hen is: de presentatie moet niet te ingewikkeld zijn. Arlen Poort ziet in de Verenigde Staten soms voorbeelden waar hij maar door en door en door moet blijven klikken. Hij vindt wel dat het een ontdekkingstocht moet zijn, maar zonder dat er een hoge drempel is. Je moet de bezoeker van je website, want heel vaak zijn het dan interactieve dingen, niet een taak geven. Laura Wismans is het met hem eens. Ik vind wel dat journalistiek altijd het verhaal moet vertellen en niet alleen het neerplempen en succes ermee. Volgens Arlen moet je mensen een beetje bij de hand nemen. Dat bedoelt hij niet paternalistisch. Je moet niet zomaar iets over de schutting flikkeren bij een lezer of een bezoeker van je website en zeggen: Zoek het maar uit. Beter is volgens hem om te laten zien waarom iets interessant is. Ook Tak denkt dat je data zo makkelijk mogelijk moet presenteren. Er zijn ongetwijfeld mensen die er ook in genteresseerd zijn om in de data te zoeken, maar dat is niet de doorsnee kijker of gebruiker. De doorsnee kijker wil volgens hem snel consumeren. Hij denkt daarom dat je mensen wegwijs moet maken. Ook Jerry Vermanen richt zich op het gemak van de lezers en niet op grafische hoogstandjes. Als je hele ingewikkelde arty farty dingen gaat maken - dat kost je heel veel tijd, maar lezers zijn ook gewoon minder geneigd om zoiets heel snel te begrijpen. Voor hele grote projecten zou hij wel de tijd kunnen nemen om lang na te denken over allerlei grafische mogelijkheden, maar daarbuiten niet. Het is vaak gewoon makkelijker om uit zon poule van standaard visualisaties te graaien want dat communiceert gewoon veel beter en dat werkt sneller. Dimitri Tokmetzis zegt: De beste visualisaties vind ik de simpelste. Dat je gewoon in een klap ziet wat er aan de hand is. Bij RTL letten ze tegenwoordig meer op de presentatie dan bij de eerste dataprojecten. We proberen het op internet wat beter te doen. Het presenteren van de gegevens was vroeger een beetje houtje-touwtje. Gewoon: alle gemeentes op een rij en dan moest je jouw eigen gemeente er maar tussen zien staan. Nu proberen we het op internet beter te presenteren, zodat het

77

NERD MET VIJF POTEN

MASTERSCRIPTIE JAN KRUIDHOF

gebruiksvriendelijker is. Dat je er ook echt wat aan hebt. Die ontwikkeling moet nog verder dan nu, maar dat is wel de belangrijkste verandering. De resultaten beter proberen weer te geven. 5.6.14 Gratis tools De visualisaties van Sargasso worden vaak met eenvoudige programmas gemaakt. Tokmetzis begint een project in Excel en stapt vanuit daar vaak over op Google Docs. En vanuit daaruit kun je aan visualisaties werken. Ik vind de visualisatietechnieken in Google Docs beter. Omdat ze interactief zijn en je kan er meer mee. Je kan niet alleen een lijngrafiekje of een kolommetjes maken, maar ook bewegende grafieken en scatter plots [puntenwolken]. Hij is erg blij met de mogelijkheden van de gratis software. Plus: je kan ook heel makkelijk kaarten maken, met Fusion Tables. En daar kun je wel databases mergen [samenvoegen]. Gratis software is niet altijd afdoende. Tokmetzis vindt de visualisaties van Excel ook niet voldoende. En Google Charts werkt niet altijd even goed. En alle visualisaties moeten wel ongeveer dezelfde stijl hebben. Dus ik heb nu de programmeur die we hebben opdracht gegeven om een aantal templates [sjablonen] te bouwen en een JAVA-library zodat we in ieder geval een uniforme manier van presenteren gaan krijgen. Uniformiteit is ook bij de NOS belangrijk. Toen hier voor het eerst een treemap online werd gezet, is besloten om er een te laten maken. Er bestaan wel gratis tools voor, zoals ManyEyes, maar die was volgens Anke te lelijk met embedden. Bovendien wilden de NOS-medewerkers dat een tool herbruikt kan worden zonder elke keer iets opnieuw te hoeven programmeren. 5.6.15 Consequent visualiseren Als datajournalist moet je ook consequent zijn bij het visualiseren. Dat merkte Jasper Koning toen een televisievisualisatie minder sterk overkwam dan gehoopt. Wij wilden heel graag laten zien dat er [aan het einde van Koninginnedag] nog een laatste piek rond Amsterdam Centraal Station was, waar mensen de laatste trein naar huis namen. En we wisten ook dat die er was en we wisten ook dat die inderdaad daar te zien was, alleen hij kwam er visueel niet zo sterk uit. Wat te doen? Je kan ook gewoon het Centraal Station wat harder op laten lichten en vertellen dat mensen daar de laatste trein nemen. Maar dat was nou precies wat ze niet wilden doen. We wilden dat aan de hand van de data doen en daar zijn we wel zo strikt mogelijk in geweest, van: je moet de data visualiseren, anders kun je gewoon een mooie animatie maken. Televisiemedewerkers zeiden: Ik zie het niet scherp genoeg, kun je niet gewoon wat oplichten? Nou nee, dat moet wel binnen de verantwoorde grenzen die je bedacht hebt. Het moet nog wel ergens op slaan.

78

NERD MET VIJF POTEN

MASTERSCRIPTIE JAN KRUIDHOF

6. Conclusie
Datajournalistiek heeft de afgelopen jaren steeds meer aandacht gekregen. Er werd veel over gesproken, maar er werden wereldwijd ook daadwerkelijk veel mooie projecten gepresenteerd. Hieruit bleek opnieuw dat data prachtige kansen biedt voor de journalistiek. Maar hoe pak je die dataprojecten precies aan? Daar hadden de Nederlandse pioniers op het gebied van datajournalistiek het nog wel lastig mee. Welke workflow en routines moet je hanteren? Die behoefte vormde de aanleiding tot dit onderzoek, waarvan de hoofdvraag luidt: in hoeverre verschillen de workflows en routines van Nederlandse datajournalisten? Een antwoord op deze vraag werd gezocht door kwalitatieve onderzoeksinterviews af te nemen bij Nederlandse journalisten die zich intensief bezighouden met datajournalistiek. Voorafgaand aan de presentatie van de onderzoeksresultaten werden de ontwikkelingen op het gebied van datajournalistiek in perspectief geplaatst. De eerste oproep tot datajournalistiek zoals we dat nu kennen kwam van de Amerikaanse journalist en programmeur Adrian Holovaty. Hij nam geen genoegen met de digitalisering van oude journalistieke vormen. Holovaty wilde de mogelijkheden van het web benutten. Van een brand, zo liet hij zien, kun je een kort verslagje schrijven, maar je kunt ook een overzicht maken van meerdere branden waar je alle gerelateerde feiten in een gelaagde interface presenteert. Holovatys oproep vond gehoor en geleidelijk aan gingen meer journalisten zich bezighouden met data. Het lastige van zon nieuwe manier van denken is wel, dat datajournalistiek moeilijk in woorden te vatten is. Het omvat een overlappende set van uiteenlopende competenties uit verschillende werkvelden. De statistiekmethoden uit de sociale wetenschap, de technieken om kaarten te maken uit Geografische Informatie Systemen (GIS), de visualisaties van grafisch vormgevers en allerlei technieken van computerwetenschappers, zoals programmeerkennis. Sommige datajournalisten zeggen dat het niet uitmaakt wat je definieert als datajournalistiek, maar in Nederland zijn er verschillende journalisten die hier wel waarde aan hechten. Zowel de ervaren datapionier Dick van Eijk als de jongere dataprofeet Jerry Vermanen hebben betwijfeld of het terecht dat bepaalde producties het label datajournalistiek werd gegeven. Zo stelde Vermanen dat de redactie van RTL Nieuws niet zo vaak aan datajournalistiek doet als zij zelf denkt. Iets is volgens Vermanen pas datajournalistiek, zodra je een goede analyse volgens een datajournalistiek proces hebt toegepast. Anderzijds geeft hij toe dat je ook zou kunnen zeggen dat niet al zijn werk voor Nu datajournalistiek is. Overigens zeggen ook een aantal van de voor

79

NERD MET VIJF POTEN

MASTERSCRIPTIE JAN KRUIDHOF

dit onderzoek genterviewde journalisten dat zij zichzelf niet beschouwen als echte datajournalisten, hoewel zij zich wel intensief bezig houden met data en journalistiek. Holovaty was niet de eerste journalist die de waarde van data inzag. In de jaren zestig lanceerde Philip Meyer al het begrip precision journalism en in de jaren tachtig deed Computer Assisted Reporting (CAR) haar intrede. In Nederland was Dick van Eijk van NRC Handelsblad de eerste journalist die zich hiermee bezighield. In 2011 was Nu de eerste website die een fulltime datajournalist in dienst nam. Er volgden meer datajournalistieke projecten, zoals RegioHack en Nederland van Boven. Het verschil tussen CAR en datajournalistiek is volgens Philip Meyer vooral dat er vroeger veel gezocht moest worden naar informatie en dat er nu zoveel informatie is dat het verwerken ervan belangrijker is geworden. Maar hoe doe je dat? Verschillende journalisten en wetenschappers brachten de workflow van datajournalisten in kaart. En hoewel er verschillen waren in het aantal stappen, kwamen een aantal stadia in alle workflows terug: het verkrijgen van data, het opschonen van data, het verwerken en analyseren van data en het presenteren van een item. Maar ja, dit waren bij wijze van spreken slechts de ingredinten; hoe maken Nederlandse datajournalisten hier nu een taarten van? Tijd om een kijkje in de keuken te nemen. Maar als we mee mogen kijken, moeten niet alleen letten op de volgorde waarin een project wordt opgebouwd, maar ook op de kleine details en de schijnbaar vanzelfsprekende acties: de routines. Deze rituelen kunnen het journalistieke eindproduct behoorlijk benvloeden. De gesprekken werden gevoerd met acht journalisten: Erik Bloem (Altijd Wat), Jasper Koning (Nederland van Boven), Arlen Poort (NRC Handelsblad), Andr Tak (RTL Nieuws), Dimitri Tokmetzis (Sargasso), Anke Vellenga (NOS Journaal), Jerry Vermanen (Nu) en Laura Wismans (nrc.next). Zij werden geselecteerd omdat hun nieuwsorganisaties ten tijde van het onderzoek het meest intensief bezig waren met datajournalistiek. Om de gesprekken met de journalisten wetenschappelijk zo bruikbaar mogelijk te maken, werden de gespreksonderwerpen deels gestructureerd. Hierbij is een deel van de vragen en gespreksonderwerpen van tevoren vastgesteld. Het vastgestelde gedeelte bestond uit de volgende vijf aan het datajournalistieke werk gerelateerde themas: doelstelling, onderwerpen, organisatie, medewerkers en werkwijze. Uit de gesprekken over deze themas kunnen na analyse een aantal conclusies worden gedestilleerd. Sommige zijn schijnbaar vanzelfsprekend, maar daarom niet minder relevant. De doelstelling van de meeste datajournalistieke projecten van de onderzochte nieuwsorganisaties is over het algemeen hetzelfde: ze willen nieuws brengen. Bij vier van de zeven onderzochte nieuwsorganisaties is dit het voornaamste doel. De overige drie organisaties maken ook graag nieuws, maar nieuwswaarde is geen vereiste voor hun producties. Twee

80

NERD MET VIJF POTEN

MASTERSCRIPTIE JAN KRUIDHOF

organisaties focussen zich specifiek op het visualiseren van data. De meeste organisaties stellen zich ook ten doel om hun publiek zo persoonlijk mogelijk te benaderen. Die persoonlijke benadering heeft wel gevolgen voor de onderwerpskeuze. Onderwerpen die het publiek niet raken zijn moeilijk te slijten en vallen daardoor vaak af, ook al zijn ze belangrijk. Andere onderwerpen worden juist sneller gekozen, omdat het publiek ervan houdt. Zo helpt het op televisie als een onderwerp dramatisch is en als er beweging in zit. Dit maakt GPS-bestanden populaire datasets. Sommige onderwerpen, zoals discriminatie, zorg en migratie, komen opvallend veel voor in datajournalistiek. Volgens de journalisten komt dit mede omdat de overheid hier veel gegevens over vrijgeeft. De journalisten zoeken het liefst zelf hun datasets, maar dit kost veel tijd. Drie van de zeven genterviewden stellen dat ze door tijdgebrek niet toekomen aan onderwerpen die ze wel zouden willen behandelen. Tijdgebrek? Schakel dan je publiek in, zou je kunnen zeggen. Maar crowdsourcing is in de Nederlandse datajournalistiek tot nu toe geen succes. Journalisten betwijfelen of het publiek wel mee wil werken en of de verkregen data betrouwbaar is. Projecten waarbij crowdsourcing werd geprobeerd verliepen problematisch. Wat soepeler verloopt, is de samenwerking met bedrijven. Wat hierbij wel een groot obstakel is, is dat journalisten slechts beperkte mogelijkheden hebben om te controleren of de verkregen data wel waarheidsgetrouw is. Voor Nederland van Boven vormde het Commissariaat van de Media een ander obstakel, omdat dit data zag als iets van waarde. De VPRO mag als publieke omroep geen dingen van waarde aannemen en daarom ook geen data, was de gedachte. Dit bezorgde de programmamakers veel kopzorgen, maar de zaak is uiteindelijk uitgepraat. De makers van Nederland van Boven hadden wel een relatief groot budget voor iedere aflevering. Verschillende andere journalisten worden door een krap budget beperkt in hun datajournalistieke mogelijkheden. Bij twee nieuwsorganisaties worden datajournalistieke projecten bemoeilijkt omdat er door de leidinggevenden weinig tot geen geld voor vrij wordt gemaakt. Wat per organisatie duidelijk verschilde, was de mate waarin journalisten geholpen werden door hun collegas met datajournalistieke projecten. Bij drie van de onderzochte organisaties stappen collegas van de datajournalisten wel eens op hen af met een dataset. Maar bij drie andere organisaties gebeurt dit bijna nooit. Datajournalistieke projecten kunnen ook benvloed worden door de omvang van een organisatie. De NOS is bijvoorbeeld zon grote organisatie. Dit heeft als voordeel dat er veel specialisten zijn, maar als nadeel dat de communicatie soms moeizaam verloopt en dat beslissing langzaam worden genomen. Hoe groot je budget ook is en binnen wat voor organisatie je opereert, uiteindelijk ben jij als journalist verantwoordelijk voor je datajournalistieke project. Maar wat moeten medewerkers in

81

NERD MET VIJF POTEN

MASTERSCRIPTIE JAN KRUIDHOF

huis hebben om zon project goed te kunnen aanpakken? Een goede datajournalist moet allereerst een goede journalist zijn, stelden twee van de genterviewde journalisten. Technische kennis is niet noodzakelijk, die kun je gaandeweg wel opdoen. Enig gevoel voor vormgeving, internet, het werken met getallen en het checken van feiten is wel handig. Maar weinig mensen blinken op al deze vlakken uit en vier van de journalisten zijn het er dan ook over eens, dat je een datajournalistiek project het beste in een team kunt aanpakken. Zon team zou idealiter moeten bestaan uit een journalist, een technisch medewerker en eventueel een vormgever. Van de genterviewden kan n journalist al behoorlijk programmeren en vier journalisten zouden graag meer programmeerkennis in huis halen of verwerven. Een van de genterviewden heeft overigens nog geen behoefte aan een programmeur. In het theoretisch kader zijn verschillende workflows beschreven. De genterviewde journalisten herkennen zich wel in deze werkwijzen en vinden de modellen ook wel handig, maar de stappen worden lang niet altijd netjes gevolgd. Bij de NOS is de workflow het meest gestructureerd, omdat hier een grote groep mensen moet samenwerken. Hoewel de journalisten niet altijd een vaste werkwijze volgen, hebben sommigen wel routines voor onderdelen van hun werk. In het theoretisch kader werd ook beschreven hoe vanuit de universitaire wereld werd geadviseerd om te beginnen met een vraag. Twee journalisten waarschuwen wel, dat je ook moet kijken of de benodigde data om die vraag te beantwoorden wel beschikbaar is. Het is makkelijker om te beginnen met data die er al is. Data verkrijgen betekent nog niet dat die bruikbaar is. Journalisten maken nog geregeld mee dat verkregen data onvolledig of onbruikbaar is. Maar gelukkig ervaren twee van hen ook, dat het verkrijgen van data bij officile instanties langzamerhand makkelijker gaat. Een instantie waar erg veel datasets worden verkregen, is het Centraal Bureau voor de Statistiek (CBS). Veel berichten van het bureau worden overgenomen. Een journalist vindt dat je hier wel mee moet uitkijken. Journalisten zoeken het liefst naar originele data, maar de manieren waarop ze dit doen, verschillen nogal. Zo gebruiken sommige journalisten de Wet Openbaarheid Bestuur (WOB) bijna nooit, terwijl anderen hier wel regelmatig data mee opvragen. Sommigen vragen eerst via de normale weg of ze data mogen krijgen en andere zetten direct de WOB in. Ook scrapen is niet overal even populair. Sommige journalisten scrapen nooit om data te krijgen en anderen doen dat juist iedere week. Over de presentatie van de data zijn de journalisten wel redelijk eensgezind: dat moet niet te ingewikkeld. Het is leuk om je publiek veel opties te geven, maar je moet je kijkers en lezers wel leiden. Bovendien moeten visualisaties van een nieuwsorganisatie er het liefst wel uniform uitzien. Gratis tools kunnen erg handig zijn, maar zijn niet altijd even mooi. Tenslotte is het belangrijk dat je wel consequent bent in het visualiseren. Spreekt de

82

NERD MET VIJF POTEN

MASTERSCRIPTIE JAN KRUIDHOF

visualisatie niet voor zich, dan kun je de boel een beetje extra aanzetten. Maar dan maak je animatie en geen datajournalistiek. Kortom: zijn er verschillen te vinden tussen de manieren waarop de onderzochte nieuwsorganisaties hun datajournalistieke projecten aanpakken? Jazeker. Wat vooral opvalt, is dat sommige organisaties wel wobben en scrapen, terwijl anderen dit niet doen. Via deze wegen is veel interessante data te verkrijgen. Ook is het opmerkelijk dat sommige journalisten wel geholpen worden door hun niet-in-data-gespecialiseerde collegas, terwijl anderen amper wat van hun collegas horen. Een kleine tip zou al een goede aanleiding kunnen zijn voor een mooi dataproject. Wat overheerst zijn echter de overeenkomsten. De meeste genterviewde journalisten zijn op zoek naar nieuws, hun workflow komt sterk overeen, crowdsourcing werkt eigenlijk bij niemand en de meeste hebben grote behoefte aan programmeerkennis op de redactie. Wanneer op Nederlandse redacties meer programmeerkennis aanwezig is, zal de datajournalistiek zich zal ongetwijfeld verder kunnen ontwikkelen. Ook academisch onderzoek kan hierbij helpen, door bijvoorbeeld te onderzoeken hoe journalisten zich ervan kunnen vergewissen dat de data die zij aangeboden krijgen authentiek is. Ook zou het waardevol zijn om te onderzoeken of overheden niet nog meer kunnen doen om data gemakkelijk beschikbaar te maken. Hoe dan ook: de Nederlandse datajournalistiek is nog volop in ontwikkeling, maar het enthousiasme en het doorzettingsvermogen van de betrokken journalisten bieden goede hoop voor haar toekomst.

83

NERD MET VIJF POTEN

MASTERSCRIPTIE JAN KRUIDHOF

Literatuurlijst
Artikelen Arthur, Charles, 'Journalists of the future need data skills, says Berners-Lee' The Guardian (1911-2010) www.guardian.co.uk/technology/organgrinder/2010/nov/19/berners-leejournalism-data. Bounegru, Liliana, 'Digging deeper: An in-depth look at data journalism in the Netherlands' Data Driven Journalism (06-12-2011) datadrivenjournalism.net/news_and_analysis/doing_data_journalism_in_the_netherlands. Bradshaw, Paul, What is data journalism Data Journalism Handbook http://datajournalismhandbook.org/1.0/en/introduction_0.html. Bradshaw, Paul, How to be a data journalist The Guardian http://www.guardian.co.uk/news/datablog/2010/oct/01/data-journalism-how-to-guide. Bradshaw, Paul, The inverted pyramid of data journalism http://onlinejournalismblog.com/2011/07/07/the-inverted-pyramid-of-data-journalism/. Broekhuizen, Bas, Journalisten moeten meer experimenteren met InfoVis De Nieuwe Reporter (03-02-2010) http://www.denieuwereporter.nl/2010/02/journalisten-moeten-meerexperimenteren-metinfovis/ Dasselaar, Arjan, Waar blijven de journalistieke databases? De Nieuwe Reporter (11-03-2008) http://www.denieuwereporter.nl/2008/03/waar-blijven-de-journalistieke-databases/. Eijk, Dick van, Datajournalistiek in Nederland al twee decennia oud De Nieuwe Reporter (0105-2012) http://www.denieuwereporter.nl/2012/05/datajournalistiek-in-nederland-al-tweedecennia-oud/. Havinga, Heinze, @HeinzeHavinga Twitter (26-07-2012)

84

NERD MET VIJF POTEN

MASTERSCRIPTIE JAN KRUIDHOF

https://twitter.com/HeinzeHavinga/status/228588255887642624 . Holovaty, Adrian, A fundamental way newspaper sites need to change http://www.holovaty.com/writing/fundamental-change/ Adrian Holovaty (06-09-2006). Holovaty, Adrian, In memory of chicagocrime.org Adrian Holovaty http://www.holovaty.com/writing/chicagocrime.org-tribute/ (31-01-2008). Holovaty, Adrian, The definitive, two-part answer to "is data journalism?" Adrian Holovaty http://www.holovaty.com/writing/data-is-journalism/ (21-05-2009). Howard, Alex, 'The bond between data and journalism grows stronger' O'Reilly (04-02-2012) http://radar.oreilly.com/2012/02/data-journalism-computer-assisted-reportinggovernment.html. Ketelaar, Titia, Bonnetjesschandaal bij de Britten nrc.next http://www.NRCnext.nl/blog/2009/05/16/bonnetjesschandaal-bij-de-britten/ Levin, Adina, Database journalism a different definition of news and reader BookBlog http://www.alevin.com/?p=1391 (23-03-2009). Levy, Rachel, Journalisten moeten meer database onderzoek doen Vereniging van Onderzoeksjournalisten (25-01-2009) http://www.vvoj.nl/cms/2009/01/25/journalistenmoeten-meer-database-onderzoek-doen/ - N.B. Dit artikel is alleen te lezen voor leden van de VVOJ. LiCalzi O'Connell, Pamela, Do-It-Yourself Cartography New York Times http://www.nytimes.com/2005/12/11/magazine/11ideas1-13.html?_r=1 (11-12-2005). Lorenz, Mirko, Why journalists should use data Data Journalism Handbook (geen datum) http://datajournalismhandbook.org/1.0/en/introduction_1.html. Meijers, Jaap, 'RTL Nieuws gaat verder met datajournalistiek - znder datajournalist' De Nieuwe Reporter (05-06-2012) www.denieuwereporter.nl/2012/06/rtl-nieuws-gaat-verder-

85

NERD MET VIJF POTEN

MASTERSCRIPTIE JAN KRUIDHOF

met-datajournalistiek-zonder-datajournalist. Nieuwenhuijsen, Bas, Datavisualisatie is een andere, leuke manier om je verhaal te vertellen Spreekbuis (geen datum) http://www.spreekbuis.nl/content/2600/%22Datavisualisatie_is_een_andere__leuke_manier _om_je_verhaal_te_vertellen%22.html. Paulussen, Steve, journalistiek@internet.be. Een studie naar de mogelijkheden en gevolgen van het internet voor de journalistieke nieuwsgaring en nieuwsproductie (Gent 2003). Poort, Arlen en Melle Garschagen, Er zit maar n ding op: omlaag. Verkopers wachten maandenlang met prijsverlaging NRC Handelsblad (17-01-2009). Prenger, Mirjam, Tegels lichten De Nieuwe Reporter (11-12-2012) http://www.denieuwereporter.nl/2012/12/tegels-lichten/. Ramaer, Joost, 'Datajournalistiek, of: Nu zoekt nerd met vijf poten' De Nieuwe Reporter (24-012011) www.denieuwereporter.nl/2011/01/datajournalistiek-of-nu-nl-zoekt-nerd-met-vijf-poten/. Ringelestijn, Tonie van, 'Nederlander maakt betere Wikileaks-zoeker' Bright (02-12-2010) https://www.bright.nl/nederlander-maakt-betere-wikileaks-zoeker Rogers, Simon, @smfrogers Twitter (29-08-2011) https://twitter.com/smfrogers/status/108238296685096961. Rogers, Simon, Anyone can do it - Datajournalism is the new punk The Guardian Datablog (24-05-2012) http://www.guardian.co.uk/news/datablog/2012/may/24/data-journalismpunk Rogers, Simon, Data journalism broken down: what we do to the data before you see it The Guardian (07-04-2011) http://www.guardian.co.uk/news/datablog/2011/apr/07/data- journalismworkflow.

86

NERD MET VIJF POTEN

MASTERSCRIPTIE JAN KRUIDHOF

Rogmans, Dolf, 'Cijfers brengen de mierenhoop tot leven' Villamedia (21-10-2011). Stray, Jonathan, A computional journalism reading list Jonathan Stray (31-01-2011) http://jonathanstray.com/a- computational-journalism-reading-list. Streefkerk, Samir, 'Argos komt met nieuwe Wikileaks-zoekmachine: 'Media moeten nieuwe wegen bewandelen'' OnJo (13-10-2011) www.onjo.nl/Item.2569.0.html?&no_cache=1&tx_ttnews%5Btt_news%5D=51046 Teffer, Peter, Nederland van Boven is de ijsbreker voor de datajournalistiek De Nieuwe Reporter (23-12-2011) http://www.denieuwereporter.nl/2011/12/nederland-van-boven-is-deijsbreker-voor-de-datajournalistiek/. Thibodeaux, Troy, 5 tips for getting started in data journalism Poynter (06-10-2011) http://www.poynter.org/how-tos/digital-strategies/147734/5-tips-for-getting-started-in-datajournalism/. Tokmetzis, Dimitri, Doe mee aan de Hackathon Verkiezingen 2012 Sargasso (25-06-2012) http://Sargasso.nl/archief/2012/06/25/doe-mee-met-de-hackathon-verkiezingen-2012/. Vellenga, Anke, Datajournalistiek en visualisatie nieuwe uitdaging voor informatiespecialisten Vereniging van Pers- en Omroepdocumentalisten (09-01-2012) http://www.vpod.nl/datajournalistiek-en-visualisatie-nieuwe-uitdaging-voorinformatiespecialisten/. Vereijken, Paul, 'Hoe begin je met datajournalistiek?' Spotlight Effect (05-07-2011) www.spotlighteffect.nl/journalistiek/hoe-begin-je-met-datajournalistiek. Vermanen, Jerry. Nederland heeft een data-primeur nodig De Nieuwe Reporter (27-04-2012) http://www.denieuwereporter.nl/2012/04/nederland-heeft-een-data-primeur-nodig/. Vermanen, Jerry, Vier lessen voor beginnende datajournalisten De Nieuwe Reporter (29-022012) http://www.denieuwereporter.nl/2012/02/vier-lessen-voor-beginnend-datajournalisten/.

87

NERD MET VIJF POTEN

MASTERSCRIPTIE JAN KRUIDHOF

Vermanen, Jerry, Wat is er aan datajournalistiek in Nederland? De Nieuwe Reporter (25-042012) http://www.denieuwereporter.nl/2012/04/wat-is-er-aan-datajournalistiek-in-nederland/. Vermanen e.a., Jerry, 'Voorstelrondje: wie zitten er achter RegioHack?' RegioHack (13-09-2011) www.regiohacknl/regiohack-blog/voorstelrondje-wie-zitten-er-achter-regiohack. Vermanen, Jerry, 'RegioHack, the day after' RegioHack (12-11-2011) www.regiohack.nl/regiohackblog/regiohack-the-day-after/. Vermanen, Jerry @JerryVermanen Twitter (11-12-2012) https://twitter.com/jerryvermanen/status/278417298530918400 Vrieling, Dorien, Sargasso Verlicht, Stimuleringsfonds voor de Pers (2011) http://www.persinnovatie.nl/3312/nl/Sargasso-verlicht. Wismans, Laura, De journalistiek redden? Data! De Nieuwe Reporter (27-04-2012) http://www.denieuwereporter.nl/2012/04/de-journalistiek-redden-data/. Datajournalistiek is hot, Vereniging van Onderzoeksjournalisten (08-12-2011) http://www.vvoj.nl/cms/2011/12/08/datajournalistiek-is-hot/. Investigate your MPs expenses, The Guardian http://mps-expenses.guardian.co.uk. Money & speed: Inside the black box Tegenlicht (31-01-2011) http://tegenlicht.vpro.nl/afleveringen/2010-2011/the-future-of-finance/money-andspeed.html. MPs expenses in the news http://bit.ly/PTk5Q8. RTL Nieuws Facts Stimuleringsfonds voor de Pers http://www.persinnovatie.nl/3309/nl/rtlnieuws-

88

NERD MET VIJF POTEN

MASTERSCRIPTIE JAN KRUIDHOF

facts Top Secret America The Washington Post (18-07-2010) http://projects.washingtonpost.com/top-secretamerica/.

Monografien Aitamurto, Tanja, Esa Sirkkunen en Pauliina Lehtonen, Trends In Data Journalism (08-092011) 11 http://virtual.vtt.fi/virtual/nextmedia/Deliverables2011/D3.2.1.2.B_Hyperlocal_Trends_In%20Data_Journalism.pdf Deuze, Mark, Wat is journalistiek? (Amsterdam 2004) Eijk, Dick van, Een atlas van Nederlandse gemeenten. 2049 Buurten vergeleken (Rotterdam 1998). Eijk, Dick van en Henk van Ess, Lesmateriaal voor Computer Assisted Reporting (Amsterdam 2003). Kovach, Bill en Tom Rosenstiel, The elements of journalism. What newspeople should know and the public should expect (New York 2001). Lorenz, Mirko, Status and Outlook for data-driven journalism in: Data-driven journalism: What is there to learn? A paper on the data-driven journalism roundtable held in Amsterdam on 24 August 2010. (2010) http://mediapusher.eu/datadrivenjournalism/pdf/ddj_paper_final.pdf. Meyer, Philip, Precision journalism. A Reporters Introduction to Social Science Methods 4th edition (Lanham, Boulder, New York en Oxford 2002). Rogers, Simon, Facts are sacred - The power of data (2011). [E-book, verkrijgbaar via Amazon.]

89

NERD MET VIJF POTEN

MASTERSCRIPTIE JAN KRUIDHOF

Shoemaker Pamela J. en Stephen D. Reese, Mediating the message (New York 1996). Bundels Eimers ed., Ditty, Onderzoeksjournalistiek 2012 (Utrecht en Zellik 2012). Hart, Harm t, Hennie Boeije en Joop Cox (ed.), Onderzoeksmethoden (Den Haag 2009). Kussendrager ed., Nico, Onderzoeksjournalistiek (Groningen 2007). Vasterman ed., Peter en Peter Verwey, Computer Assisted Research and Reporting (Utrecht 1994). Presentaties Bradshaw, Paul, Data journalism (22-02-2011) slide 23/48 http://www.slideshare.net/onlinejournalist/data-journalism-city-online-journalism-wk8 Lorenz, Mirko, 'Data-driven journalism. What is there to learn?' IJ-7 Innovation-Journalism Conference (Stanford 7-9 juni 2010) www.slideshare.net/mirkolorenz/datadriven-journalismwhat-is-there-to- learn

90

NERD MET VIJF POTEN

MASTERSCRIPTIE JAN KRUIDHOF

Topiclijst interviews
Thema I: De workflow Doel: in kaart brengen uit welke stappen de totstandkoming van een datajournalistiek item bestaat en waarin de verschillende media verschillen. Relevantie: voor beginnende datajournalisten is het lastig een aanpak te ontwikkelen. Zij kunnen wat opsteken van de verschillende werkwijzen van andere media. Daarnaast is het interessant om te onderzoeken in hoeverre media die zich primair op verschillende verschijningsvormen richten van aanpak verschillen. Zijn we echt in het multimediale tijdperk aanbeland? Initile vraag: in welke stappen zou u de totstandkoming van een datajournalistiek item opdelen? Aspecten: Hoe/waarom is die aanpak ontstaan? Wat zijn de voor- en nadelen van die aanpak? Wat wordt nu anders aangepakt dan tijdens eerdere projecten? Welke opties zijn er per stap? Bijv. bij het verkrijgen van data: scrapen, WOBen, samenwerken enz. Aan de hand van welke criteria wordt een keuze gemaakt? Hoeveel tijd neemt elke stap in? (Is het antwoord: Dat varieert, dan vragen naar top 3casussen.) Wat gebeurt er na publicatie? Updates? Aanvullingen? Correcties? Voor krant en tv first: wat wordt online gepubliceerd en wat komt in krant/op tv? Wat zou u wel graag toevoegen aan uw werkwijze maar is op dit moment nog niet mogelijk? Thema II: De doelstelling Doel: in kaart brengen welke invloed de doelstelling van een datajournalist of het datajournalistieke team heeft op de items die worden geproduceerd.

91

NERD MET VIJF POTEN

MASTERSCRIPTIE JAN KRUIDHOF

Relevantie: het uiteindelijke doel kan zijn om zo snel mogelijk data te publiceren bij actueel nieuws. Het kan ook zijn om iets te onthullen wat nog niet openbaar was. Of: lezers de mogelijkheid geven om zelf informatie te vinden. Elke optie vergt een heel andere aanpak. Initile vraag: welk doel hebben jullie voor ogen wanneer jullie bezig zijn met datajournalistiek? Aspecten: Welke gevolgen heeft dat voor de werkwijze? Wat denken jullie dat jullie doelgroep graag wil zien? Is de doelstelling ook bijgesteld sinds de eerste datajournalistieke projecten? Waardoor is jullie doelstelling beinvloed? (Bijvoorbeeld: commercieel interessant volgens directie of past bij onze missie als nieuwsorganisatie, namelijk..)

Thema III: Onderwerpen

Doel: in kaart brengen wat het het uitgangspunt vormt voor datajournalistieke verhalen. Een vraag? Een dataset? Een artikel van een collega? Een beat? Relevantie: wie uitgaat van een bepaalde bron, wordt daardoor beinvloedt. De bron is dan leidend. Dit levert een ander verhaal op dan wanneer je uitgaat van een specifieke vraag. Wanneer de datajournalistiek een soort aanvulling is op een groter verhaal, heeft dit ook gevolgen. Initile vraag: hoe komen jullie aan jullie onderwerpen? Aspecten: Houden jullie bepaalde beats in de gaten? Zo ja: welke en waarom juist die? Houden jullie bepaalde websites in de gaten die data releasen? Zo ja: welke en waarom juist die? Welke aspecten maken een onderwerp interessant voor jullie? Wat voor onderwerpen zou u wel willen behandelen maar passen niet bij uw organisatie?

Thema IV: De medewerkers

92

NERD MET VIJF POTEN

MASTERSCRIPTIE JAN KRUIDHOF

Doel: te weten komen wat de professionele achtergrond van de datajournalisten is. Relevantie: de manier waarop een journalist te werk gaat beinvloedt zijn items. Net zoals zijn werkomgeving of zijn eerdere werkervaring zijn werkwijze kan beinvloeden. Hebben ze een journalistieke achtergrond of zijn het van origine designers? Zijn ze jong met frisse ideeen of ouder met veel ervaring? Daarnaast is de werkverdeling binnen het team van belang. Bij een grote redactie (zoals NOS, RTL, Volkskrant of NRC) kunnen de taken meer verdeelt worden. Bij Nu is maar een datajournalist. Sargasso organiseerde hackathons. Dit heeft ongetwijfeld gevolgen voor de totstandkoming van de verhalen, maar welke precies? Initile vraag: wat is uw achtergrond als journalist? Aspecten: Wat is zijn/hun eerdere werkervaring? Wanneer in aanraking gekomen met datajournalistiek? Wie werkt er mee aan de projecten? Vanaf welk stadium? Op welk onderdeel? Waarom juist zo? Afgekeken van andere nieuwsorganisatie? Is dit optimaal volgens iedereen? Wat is zijn/hun specialiteit? (Programmeren, vormgeving, klassieke onderzoeksjournalistiek) Waar ligt zijn/hun interesse?

Thema V: De organisatie Doel: in kaart brengen in wat voor omgeving de datajournalistieke items gemaakt worden. Relevantie: de werkwijze van een nieuwsorganisatie, ook van de niet-datajournalistieke afdelingen, kan direct of indirect invloed hebben op de datajournalistieke producties. Als de hele organisatie bijvoorbeeld gewend is aan hele korte deadlines is het moeilijker voor een datajournalist om meer tijd vrij te krijgen voor een project, want zo werken wij hier niet. Initile vraag: hoe zou u werkwijze van de rest van uw organisatie omschrijven? Aspecten:

93

NERD MET VIJF POTEN

MASTERSCRIPTIE JAN KRUIDHOF

Wat is de routine voor niet-datajournalistieke items? Hoe is het contact tussen de datajournalisten en niet-datajournalisten? Professioneel: wordt er samen vergaderd? Komen niet-datajournalisten met ideeen of verzoeken? Werken datajournalisten in dezelfde ruimte? Is de omgeving positief over datajournalistiek? Hoeveel budget en mankracht heeft de organisatie vrijgemaakt voor datajournalistiek? (Wanneer het antwoord is: dat kan ik niet zeggen, vragen met welke redactie het budget van datajournalistiek te vergelijken is.)

94

NERD MET VIJF POTEN

MASTERSCRIPTIE JAN KRUIDHOF

Transcripties
Dimitri Tokmetzis (Sargasso) Welk doel hebben jullie voor ogen als jullie bezig zijn met datajournalistiek? Een wat minder praktisch doel, maar mijn langetermijndoel is dat we een kwaliteits online medium zijn. Een kwaliteitsblog zeg ik maar. Dat we ons op onderzoeksjournalistiek gaan richten en dat ook met moderne middelen gaan doen. Wat we eigenlijk deze twee jaar doen en waar we subsidie voor hebben gekregen is eigenlijk een groot experiment waarbij we op een vernieuwende manier proberen goede verhalen te maken uiteindelijk en datajournalistiek is daar n van. WOB-journalistiek is daar ook een van en die twee gaan heel goed samen. En een derde is crowdsourcing, waar we vrij actief mee bezig zijn. Die drie vallen vaak toch wel samen in grote projecten. En wat mijn persoonlijke doel daarbij is, is dat ik uiteindelijk gewoon wil dat.. ik vind onderzoeksjournalistiek heel belangrijk en ik wil dat dat blijft bestaan en ik vind dat online media daar ook een rol in moeten hebben. Dat is ook een reden dat we samenwerken met andere media, om het gewoon betaalbaar te houden voor iedereen. Dus we delen de kosten vaak. Op die manier hebben we leuke content online, gratis voor mensen om te hebben, plus we kunnen onderwerpen agenderen die wij belangrijk vinden. Dus eigenlijk een alternatief medium, die wel goede content biedt. En datajournalistiek is daar een instrument in. Neemt niet weg dat wij ook wel zien dat op de kortere termijn datajournalistiek wel potentie heeft in Nederland, dat er veel vraag naar is en dat dit voor ons een belangrijke bron van financiering is. Iets waar wij nog groot in kunnen worden en we worden het liefst marktleider in Nederland. Maar het is dus vooral een middel, niet een doel an sich? Datajournalistiek is geen aparte vorm van journalistiek. Basale datajournalistiek zou iedere journalist moeten kunnen. Een Excel-sheet lezen of getallen lezen. Welke gevolgen heeft die doelstelling voor jullie werkwijze? We proberen onderwerpen anders te benaderen, het is eigenlijk hoe ik altijd wel heb gewerkt. Ik begin gewoon met een hele brede vraag en kijk dan welke data daarbij te vinden zijn. Proberen toch op andere verhalen te komen dan andere media doen. Zoals nu bijvoorbeeld met die politieke data. Gaan we een hackathon organiseren. Een van de manieren die we hier proberen is achtergrond bieden. We zullen er ook wel nieuws uithalen hoor. We hebben data die

95

NERD MET VIJF POTEN

MASTERSCRIPTIE JAN KRUIDHOF

teruggaat tot 1971. Wat we willen is de long view nemen, in de electorale ontwikkelingen bijvoorbeeld. Hoe is men anders gaan stemmen in Nederland. Dat zijn dingen die je juist goed met datajournalistiek kunt doen. We hebben al die data, we hebben alle enqutes er worden Nationale Kiesonderzoeken gehouden, voor en na alle verkiezingen, tot 1971 gaat dat terug dat is allemaal gecodeerde data. Dan moet je dus ook datajournalistieke middelen gebruiken om inzichtelijk te maken wat daar in zit en kijken, wat voor ontwikkelingen zitten daar nou in. En ik denk dat je dat met traditionele journalistiek niet goed kan doen. Of je moet iemand zo gek hebben dat hij dat allemaal handmatig gaat doornemen. Maar je hebt het hier over miljoenen records, dus dat lukt gewoon niet. Dus dat moet je slimmer oplossen. Dat hebben we ook gedaan met die crisis, met de hackathon, over waar vallen nu de klappen van de crisis. Een datajournalistieke benadering dwingt je om data te zoeken die nog niet wordt gebruikt. En een van de dingen die wij vonden is dat het UWV gewoon maandelijks werkloosheidscijfers per postcode bijhoudt. Die cijfers worden nauwelijks tot niet door andere media gebruikt, terwijl je daar wel heel interessant nieuws uit kan halen. Op die manier proberen we dus echt een ander soort verhalen te maken. Maar daar moet ik bij zeggen, de verhalen die je maakt, daar is datajournalistiek gewoon stap n in. Wel een hele moeilijke stap, maar wat we daarna doen is altijd gewoon is nabellen, in context plaatsen, het normale journalistieke werk om er een verhaal van te maken. Dus je uiteindelijk toch bezig om een verhaal te vertellen. Een grafiek alleen er op kwakken is eigenlijk niet genoeg, zelden genoeg. Kan wel, als de cijfers echt voor zich spreken, maar er moet altijd context bij en duiding, als het even kan. Aan de ene kant zeg je dus dat jullie achtergronden willen bieden, maar door jullie samenwerking met het ANP zijn jullie ook gedwongen om hard nieuws af te leveren. Hoe werk dat in de praktijk? Ja, we hebben eigenlijk verschillende tempo's waarin we werken. Eerste is echt het hele korte nieuws. We hebben met ANP afgesproken dat we in principe dagelijks nieuwtje afleveren, een cijfernieuwtje. Wij hoeven het niet helemaal zelf na te bellen, maar wij leveren het basismateriaal aan en een redacteur van hun gaat er vervolgens mee aan de slag, dat is heel goed te doen. Dat is gewoon klein nieuws, maar die kleine nieuwtjes doen het hartstikke goed merken we, die worden echt goed opgepikt en komen overal weer terug. Waar hebben we het dan bijvoorbeeld over?

96

NERD MET VIJF POTEN

MASTERSCRIPTIE JAN KRUIDHOF

Wat we gisteren hadden bijvoorbeeld, over treinen die rode seinen negeren, daar is onderzoek naar geweest, helemaal weggestopt in een rapportje. Dat rapportje heette ook STS Passages 2011, geen hond die dat leest natuurlijk, behalve ik dan. Daar bleek gewoon nieuws in te zetten: dat het aantal treinen dat door rood rijdt enorm is gedaald. Ik haal die data eruit, zet het even netjes op een rij, maak een basale analyse, dat gaat dan vervolgens naar ANP, die zet er een journalist op, die gaat dan rondbellen en je hebt in nieuws, in vrij korte tijd. Is dat datajournalistiek? Ik denk het niet, maar wij zitten inmiddels zo goed in die datastroom. En ik vind het wel een prettige manier van werken, want ik ben eigenlijk de hele dag bezig met allerlei databronnen en dit is gewoon een klein verhaaltje, maar laatst kwam ik ene rapport tegen over krimpgebieden in Nederland, daar zijn nieuwe bevolkingprogNOSes gemaakt, dat kun je opschalen naar veel grotere verhalen. Dus daar maken we op dit moment een groter verhaal van. Dus voor het ANP maken we iedere dag een klein verhaaltje, hup data, resultaat willen ze zien en wij ook. En n keer in de week probeer je een wat groter verhaal te maken, met wat meer body. Ofwel bijzondere data die nog niemand heeft, die we hebben gewobt soms of via ministeries heeft gekregen of via anderen, via niet-zomaar openbaar gemaakte stukken. Ehm, dat proberen we een keer per week te doen. Dat halen we wel redelijk. Daarnaast hebben we echt de grote projecten die hackathons bijvoorbeeld, waar we echt de diepte in willen gaan en daar een hele serie verhalen uit willen krijgen. Dus eigenlijk drie niveaus heb je. Lekker snel, wat meer achtergrondverhalen en de echt diepgaande stukken. Maak je verhalen die de lezers graag willen of heb je andere drijfveren? Met de korte verhaaltjes dat is toch wel veel producties draaien. Het voordeel is meer voor mij dan voor de lezers. Soms halen we er echt nieuws uit, soms zijn het stukjes waarvan je denkt: Mwoh, is de wereld door dit stuk nu een betere plek door geworden, ik denk het niet. Is ook niet erg, maar waar heel veel kranten gewoon behoefte aan hebben is eigen nieuws. Wij zijn wel zo oplettend dat we dat soort dingen oppakken. Of dat we bij een gijzeling gaan kijken: wat staat er in CBS Statline, hoeveel gijzelingen zijn er jaarlijks eigenlijk? Een beetje achtergrondinformatie. Dus ja, dat is vooral de functie. Bij de grote producties probeer je echt wel een leuk verhaal te vertellen, ben je veel meer verhalend bezig of probeer je echt iets naar boven te halen. Die grote projecten zijn echt wat meer, ideologisch gericht wil ik niet zeggen, maar dat zijn wel onderwerpen waarvan wij denken dat er meer aandacht voor moet zijn. Met name politiek bijvoorbeeld: er ligt zoveel politieke data die niet worden gebruikt, maar die wel veel meer zeggen over hoe het er aan toe gaat in de politiek. Een paar maanden geleden hadden we bijvoorbeeld Twittergedrag, de key-players op het Binnenhof geanalyseerd, een sociale

97

NERD MET VIJF POTEN

MASTERSCRIPTIE JAN KRUIDHOF

netwerkanalyse. Wat je daar uitkrijgt vond ik toch wel interessant: er kwamen bijvoorbeeld een aantal PR-mensen uit, die kwamen vrij hoog in dat netwerk eruit, die je anders gewoon niet opmerkt. En, dit was dan het eerste verhaal, een probeerseltje, maar dat algoritme wat erachter zit is gewoon lekker aan het doorsnorren en die database is al lekker aan het vollopen. Dus je krijgt een steeds beter beeld van wie er nou in dat mediaspel op het Binnenhof belangrijk zijn en wie niet. En er komen altijd namen bovendrijven die je anders niet had gezien. Die normaal in de luwte blijven, maar door die sociale netwerkanalyses toch komen bovendrijven. Een van de dingen die wij bijvoorbeeld zien is dat iedereen op het Binnenhof bijvoorbeeld totaal geobsedeerd is door Pauw & Witteman. Toch leuk als je dat kan duidelijk maken. Begin je discussie te voeren, is dat nu de bedoeling van het Binnenhof: dat je met je kop op Pauw & Witteman komt? Zo werkt het natuurlijk wel en dat weet iedereen, maar het is wel goed om af en toe te laten zien ook. Zo'n onderwerp als bijvoorbeeld over die treinen, hoe komt dat op jouw pad? Er zijn gewoon een aantal sites, waar continu alle rapporten van de overheid worden geupload. Rijksoverheid.nl, kun je gewoon kiezen wat je wil: wil je alle persberichten zien, of alle rapporten of alle jaarverslagen. Wat we vaak doen, is 's ochtends even rondje langs het CBS. Niet om te kijken naar de persberichten, maar welke tabellen zijn er gepdate. Daar zitten vaak nieuwe cijfers is, dus dat kan nieuws aanleveren en dat is waar veel journalisten niet in kijken. En hoe kies je wat interessant is? Ik bekijk altijd eerst de rapporten met de meest saaie naam. Je moet altijd de rapporten met de meest saaie naam bekijken, daar zitten vaak interessante dingen in. Waar komt het vandaan, is ook belangrijk. Je leest eerst even de inleiding en samenvatting door, bekijkt even de methodologie: hoe zijn die cijfers tot stand gekomen. Vervolgens scroll ik vrijwel meteen door naar de tabellen. De cijfers moeten het verhaal al vertellen. Maar dat zijn waarschijnlijk vaak PDF'jes. Als het heel veel cijfers zijn neem ik weleens contact op om te vragen of er ook Excel-files zijn, maar die zijn er vrijwel nooit. Je hebt wel programma's die PDF'jes omzetten naar Excel. Werkt niet altijd even goed, dus je moet handmatig wat bijwerken. Maar doe je dat allemaal al direct of kun je ook van papier lezen of er iets interessants in zit?

98

NERD MET VIJF POTEN

MASTERSCRIPTIE JAN KRUIDHOF

Nou, je voelt vaak zelf al vrij snel aan ook omdat je de samenvatting hebt gelezen en de conclusie kent.. Op een gegeven leer je die cijfers dan wat sneller interpreteren. Je voelt het meestal al snel aan. Wat ik wel vaak doe, met CBS-cijfers bijvoorbeeld, is even snel een grafiekje maken. Zodat je in ieder geval een trend ziet. Kun je daarna verder gaan zoeken, wat gaan schuiven, data toevoegen. Ik maak al heel snel een schifting: dit wel, dit niet. Is het voor een artikel al voldoende als je alleen de interessante dingen uit een rapport opschrijft of heb je een verplichting dat je er altijd een grafiekje bij doet. Nou, het ANP neemt geen grafieken af. Dat deden we eerst wel, maar klanten hoeven het gewoon niet, nemen het niet over, dus dan is het een beetje zonde van je tijd. Voor Sargasso plaats ik niet alle stukken, maar meestal wel en daar doe ik meestal wel een grafiek bij, omdat ik hem toch al heb gemaakt. Heb je ook bepaalde beats, bepaalde onderwerpen die je in de gaten houdt? Ehm, ik zit uit persoonlijke interesse veel op privacy-onderwerpen, maar daar is niet zoveel data over. Wat bedoel je precies met privacy? Vooral in relatie met technologie. Datapreventie enzo. Privacy is een onderwerp dat het goed doet bij ons, we hebben nu bijvoorbeeld een project waar we allen toezichtcamera's in Nederland in kaart brengen. Dat is een voorbeeld van zo'n groot project dat we doen, met heel veel vrijwilligers. Kijk dan, als je met veel vrijwilligers werkt, moet je gewoon een onderwerp hebben dat ze aanspreekt. Politiek doet het altijd goed. Economie. Armoede, gelijkheid. Privacy. Daar moet je echt wel rekening mee houden. Die kun je niet inzetten voor klusjes over eh, bepaalde activiteiten, maar als het ze echt raakt vinden ze het wel leuk om mee te werken. Ik probeer verder voor de korte dagelijkse verhaaltjes wel verhalen te maken die echt ergens over gaan, dat mensen raakt of veel mensen aangaat. Dat het voor een hoop mensen interessant is. En wat is dan jouw definitie van wat mensen raakt? Emotioneel? Nou, als het gaat over [treinen die] door een rood sein rijden; heel veel mensen rijden met de trein. Die willen wel weten hoeveel treinen er nu door rood rijden, bijvoorbeeld. Maar niet emotioneel, het zijn toch cijfers, die zijn emotioneel wat afstandelijk.

99

NERD MET VIJF POTEN

MASTERSCRIPTIE JAN KRUIDHOF

Wat we wel veel hebben gedaan is migratie. Enerzijds omdat er zoveel onzin over wordt gezegd, anderzijds ook toeval want een van onze vrijwilligers zit daar heel goed in. Dus die levert altijd hele goede data. Maar we vonden het ook een belangrijk onderwerp. Daar hebben we ook wel een paar keer echt hard nieuws uit gehaald. Kamervragen mee weten te krijgen. Bleek bijvoorbeeld dat de IND gebruik maakte van verkeerde cijfers. Zijn er ook nog onderwerpen die je wel wilt behandelen, maar het nu niet verkocht krijgt aan lezers of aan het ANP of het gaat om een of andere manier niet? Nou, het is meer tijdgebrek. Die grote onderwerpen zijn gewoon leuk om te doen, die grote dingen. Maar het kost ook allemaal heel veel tijd. Ik ben bijvoorbeeld met een aantal NGO's in gesprek om over de Europese Lobby een hackathon te organiseren. Om die lobby in Europa in kaart te brengen. Maar dat kost gewoon veel tijd. Zijn er dingen waarvan je denkt dat ze wel gecheckt kunnen worden, maar.. Ach, zoveel. Dat is een van de redenen dat ik met een programmeur wil gaan werken. Kijk, wij werken redelijk low-tech. In die zin, dat wij geen flitsende visualisaties hebben, werken veel met Excel, Google Refine, Fusion Tables en daar doen we het eigenlijk wel mee. Ehm, we zijn veel meer gefocust op het nieuws en op het verhaal zelf. Mijn mening is dat heel veel visualisaties eigenlijk weinig toegevoegde waarde hebben. Vaak zijn het zoekplaatjes, ook de interactieve dingen mensen gebruiken het gewoon niet. Ze willen gewoon weten: wat staat daar nou in. Ik ben zelf ook zo'n luie lezer, ik ga echt niet alles lopen aanklikken. Heb ik gewoon geen zin in, of het moet me persoonlijk aangaan. Ehm, nu ben ik een beetje afgedwaald. Ohja, ik zou veel meer databases willen koppelen. Een van de dingen die bij de hackathon naar boven kwamen is.. Een van de dingen die ze hebben gedaan, ze hebben de financile posities van scholen bekeken. Wat zijn de reserves, afgezet tegen het leerlingenaantal en tegen het soort bestuur is het katholiek of protestants. En daar kwamen echt inzichten uit naar voren die je er anders gewoon niet uithaalt. Maar dan heb je wel een goede programmeur nodig die dat even voor je kan doen. Dat lukt ons met Excel nog niet. Dat soort dingen zou ik wel meer willen aanpakken. Van die echt grote databases en dan geautomatiseerd naar verbanden gaan zoeken. Nu is het toch vaak meer journalistiek gedreven, handmatig, op je guts kijken: waar kan nog wat zitten. Ik heb het idee dat we nogal wat over het oog zien. Een van de dingen die ze [de deelnemers aan de hackathon] ontdekten was dat er op Vlieland meer leerlingen ingeschreven stonden dan er kinderen van die leeftijd zijn. Dus daar is iets geks aan de hand.

100

NERD MET VIJF POTEN

MASTERSCRIPTIE JAN KRUIDHOF

Daar krijgt een school meer geld dan hij recht op heeft? Ja, dat is daar aan de hand. Dat is de meerwaarde van datajournalistiek. Dat is voor mij het echte werk. Zo zijn er veel meer dingen. Er is nog zoveel data beschikbaar. Je kunt er dingen in vinden, en dat vinden is gewoon deels geprogrammeerd. En programmeurs zijn duur, die kosten zo 80 euro per uur. En journalisten zijn gewoon goedkoper. Daar komen we gewoon nog onvoldoende aan toe. We hebben nu eindelijk een beetje een workflow, dat het allemaal een beetje loopt enzo, dus de volgende stap is om dat soort klussen te gaan doen. En zelf veel informatie binnen te slepen. Veel meer gaan scrapen. Er is zoveel informatie beschikbaar die niet actief worden vrijgegeven, maar waar wel heel veel interessante dingen in staan. Is dat ook over allerlei verschillende onderwerpen? Jaja, we hebben de hele database van het College Bescherming Persoonsgegevens bijvoorbeeld. We komen er gewoon niet aan toe om daar analyses op los te laten. Maar die moeten we eigenlijk eens gaan koppelen aan het KvK-register. Zodat je dus kan zien van hoeveel in dat register van het CBP staat of ze persoonsgegevens verwerken. Mooi zou zijn als je daarin kan zien welke bedrijven daar nu niet in staan, die wel persoonsgegevens verwerken. Ik ben er wel eentje tegengekomen die dat niet doet bijvoorbeeld, maar dat zou je eigenlijk geautomatiseerd moeten doen. Je zou ook verbanden kunnen zoeken, van welke clusters van bedrijven hebben bewaren nou welke informatie. Het is nog beter als je data kunt combineren. Stel: ik geef mijn data aan bedrijf X of instantie, waar gaat het dan naartoe? Of waar kunnen mijn gegevens dan naartoe gaan? Waar komt het dan terecht? Daar kun je natuurlijk hele leuke dingen mee doen. Maar ja, geen tijd. Slotvraag over onderwerpen: onderwerpen als armoede en politiek komen veel naar voren. Je zei al: armoede is ook gewoon omdat er veel cijfers over zijn. Is er nog een andere reden waarom die onderwerpen veel aan bod komen? Ja, dat past een beetje bij ons blog. We zijn een beetje links, schijnt. Ikzelf niet overigens, ik ben a-politiek. Maar ik vind dat wel een belangrijk onderwerp, zeker in deze tijd van crisis. Ik vind dat je, dat we daar nog veel te weinig over schrijven. Armoede of politiek?

101

NERD MET VIJF POTEN

MASTERSCRIPTIE JAN KRUIDHOF

Armoede. Ehm, dus ja, ik vind het wel een belangrijk onderwerp en als je dan wat met cijfers kunt doen, graag. Ik vind het belangrijk dat mensen wel inzicht hebben in hoe het met mensen gaat. We doen het nog onvoldoende, dat zeg ik er meteen bij. Politiek: Nederlanders vinden politiek interessant en er is veel data over beschikbaar. Weet je, het is in deze situatie nog een beetje het Wilde Westen. Er is heel veel data beschikbaar en we zijn nu gewoon aan het kijken, wat kun je ermee, gewoon proberen. Zo werkt het vaak. Maar er zijn nog meer onderwerpen waar ik graag mee bezig zou willen. De Europese Unie bijvoorbeeld. Ook een belangrijk onderwerp. Trek je alleen niet zoveel lezers mee. Ik weet nu al dat ik dat verhaal moeilijk kan slijten. Dat is zonde, he? Ja, wordt vaak als een ver-van-mijn-bed-show gezien, terwijl het dat absoluut niet is. Je merkt wel dat er nu meer interesse voor is. Maar daar is gewoon heel veel te halen en daar is ongelovelijk veel data over. Over subsidies, structuurfondsen, dat soort dingen. Dat is allemaal gedocumenteerd. Alle begrotingen. Zijn wel honderd verhalen te halen. Workflow: In welke stappen zou je de totstandkoming van een datajournalistiek project van jullie beschrijven? Je hebt vier basisstappen, die zijn bekend. Vinden, verwerken, opschonen, analyseren en visualiseren. Dat blijft gewoon. Daar zit je aan vast. Hoe dat precies gaat, dat ligt aan het onderwerp. Of je er nieuws uit wilt halen of achtergrond. Kijk, visualiseren doen wij weinig, dat is echt een vak apart. En ik denk dus dat visualisaties weinig toevoegen, op dit moment nog, komt wel. Ik zeg vaak: de beste visualisaties vind ik de simpelste. Dat je gewoon in een klap ziet wat er aan de hand is. Ik hou zelf wel van treemaps. Treemaps? Van die blokken. Dat je bijvoorbeeld ziet: mn begroting is dit, dit is ontwikkelingshulp, dat je een beetje de verhoudingen ziet. Dat soort dingen, daar hou ik wel van. Dat vertelt gewoon een verhaal. Maar van die zoekplaatjes, mwoh. Als iemand goed kan visualiseren: mooi hoor, prachtig, graag. Maarrem, ja het ligt er wel aan of het nieuws is of niet of meer achtergrond. Ik bedoel, als je echt op zoek bent naar hard nieuws moeten de data echt kloppen. En we komen vaak tegen dat de data niet kloppen. Omdat er toch fouten in zitten, zelfs in het CBS. Ik heb CBS ook weleens moeten bellen, van: Kijk hier nog eens naar, volgens mij klopt het niet helemaal. Omdat er gewoon rare dingen uit komen.

102

NERD MET VIJF POTEN

MASTERSCRIPTIE JAN KRUIDHOF

Als je het gewoon per stap bekijkt, allereerst bijvoorbeeld vinden: welke opties heb je dan voor jezelf? De vraag is of je het jezelf makkelijk of moeilijk maakt. Makkelijkste is data gebruiken die er al zijn. Die makkelijk te vinden zijn, het CBS bijvoorbeeld of Eurostat. Waarvan je weet dat ze tamelijk correct zijn. Betrouwbaarheid is een groot probleem. Ik doe dit nu ruim een jaar en ik moet zeggen: ik vertrouw geen enkele cijfers meer. We vinden altijd fouten in cijfers. Rapporten enzo moet je altijd wantrouwen, want de cijfers kloppen vaak gewoon niet. Er zijn heel veel bronnen: uit rapporten kun je data halen, open data, de overheid zet ook steeds meer open data centraal neer. Je moet gewoon een beetje in de gaten houden. Af en toe krijg je iets opgestuurd van iemand. Het leukste is, maar ook het meest bewerkelijke, je eigen datasets maken. Bijvoorbeeld wat wij hebben gedaan: alle gemeenten WOBen om hun cameraposities. Dat is vreselijk veel werk, maar dat levert wel heel veel op. Als je het goed doet levert het een heel mooi verhaal op, maar het is wel gewoon heel veel werk. Dat is leuk: zelf turven en tellen en op die manier aan je data komen. Wat we in het begin deden met het ANP is gewoon onderwerpen verzinnen en dan gingen we vervolgens kijken of de data er ook zijn. Daar zijn we vrij snel van teruggekomen. Meer dan de helft van de verhalen kregen we gewoon niet rond, omdat de data er niet bleken te zijn. Of te moeizaam of teveel werk om te krijgen of te duur. Dus wat ik wel steeds meer ben gaan doen is echt kijken: welke data zijn er eigenlijk. En dan kijken welk onderwerp, welke journalistieke vragen ik daarop los kan laten. Dat scheelt gewoon cht heel veel werk. Dat zou mijn advies zijn aan iedereen die ermee begint: werk vanuit de data, niet alleen vraaggericht. Vraaggericht kan en dat levert soms hele mooie verhalen op, maar dat levert ook heel veel teleurstellingen op. Bas Broekhuizen die zei juist: begin eerst met de vraag. Vragen zijn heel belangrijk, natuurlijk. Je moet altijd vragen stellen. Soms is het ook allebei een beetje. Maar je moet wel weten dat de data er zijn. Anders ben je gewoon voor niks bezig. Ja. We hebben heel veel tijd eraan verspild, aan alle onderwerpen waar we niet genoeg data voor konden vinden. Of dat de data maar tot 2009 lopen ofzo en journalistiek niet meer zo interessant zijn. Dat ze onvolledig waren. Dat we vaak wel iets vinden, maar het is te weinig vaak. Niet betrouwbaar genoeg, zijn we ook vaak tegenaan gelopen. Dat je het dan toch maar niet doet. Op die manier moesten we heel veel verhalen afleggen en dat is gewoon zonde van je

103

NERD MET VIJF POTEN

MASTERSCRIPTIE JAN KRUIDHOF

tijd. Als je er in komt, ik zit nu een soort dataflow, overal zie ik data en dat je daar ook wel verhalen in ziet en bij bedenkt. Zou je daar iets meer over kunnen vertellen? Dat is juist wat interessant is voor mensen Dat hoor ik ook wel van collegas, dat die er allemaal mee worstelen: Hoe kom je aan je verhalen? Ik vind het niet zo moeilijk. Het punt is: veel datajournalisten zijn geen journalisten, op dit moment. Zon Jelle Kamsma is geen journalist en Jerry is eigenlijk.. Die komt van De Stentor toch? Ja, maar hij heeft geen klassieke verslaggeversrol gehad. Je moet gewoon journalistiek kijken naar data. Gewoon wie, wat, waar, wanneer, waarom? Ja dat, maar ook.. Op een gegeven moment, als je een paar jaar in de journalistiek werkt, dan ontwikkel je een gut feeling voor wat nieuws is en wat niet. Menig journalist kan dat beamen, dat kun je ook niet meer uitzetten. Op ieder feestje, met wie je ook praat, dan denk je meteen: Zit hier een verhaal in? Zo is het ook met data: Zit hier in een verhaal in? En ja, gewoon zelf de koppeling leggen met de actualiteit of met de achtergrond. Of je eigen algemene ontwikkeling daar op loslaten. Want als je veel weet van een onderwerp dan kun je meteen zien aan data: Hier kan nieuws in zitten. Net zoals je dat in normale journalistiek hebt als je een rapport ziet. Dat komt van die en die, door die gepubliceerd en dat is de achtergrond - daar zou weleens nieuws in kunnen zitten. Zo werkt het ook met data. Het is echt wel een journalistiek proces. Maar welke routines heb je bijvoorbeeld, bijvoorbeeld dagelijks? Ja, ik weet niet, dat gaat gewoon dag en nacht door. Zoals de journalistiek werkt. Kijk ik heb wel een rondje van sites waar ik even langs ga om te kijken naar datasets en waarvan je weet.. Je moet al weten dat de leuke dingen vaak zitten in de saaie dingen. Van wie komt het? Wat zou erachter kunnen zitten? Dan kun je wat gerichter gaan zoeken. Als je zon ding opent, bijvoorbeeld over die treinseinen, dat je dan ook weet: er is net een ongeluk gebeurt. Dus misschien dat daar wat meer in zit, dat het relevant is nu. En is het ook vaak zo dat je.. Stel je voor, je hoort nieuws op de radio, dat je denkt: Kan ik daar een dataset bij zoeken?

104

NERD MET VIJF POTEN

MASTERSCRIPTIE JAN KRUIDHOF

Ja hoor, als ik even niets heb dan kijk ik even of er data bij te vinden zou zijn. Gewoon even iets snels tussendoor. Een ander ding wat ik ook doe is gewoon een enorme bak met data pakken en gewoon kijken wat er in zit. Dan kijk je naar stijgingen, dalingen, dat soort dingen, daar zit potentieel nieuws in. Ja, dan vind je het wel. Wat zou je aan iemand die wel die journalistieke achtergrond heeft adviseren? Hoe heb jij die workflow ontwikkeld? Leer Excel. Als je denkt: hier zou wat in kunnen zitten, plemp het in Excel, ga eens wat grafieken maken, ga ze een beetje sorteren enzo. Dan merk je snel genoeg, zitten er rare afwijkingen in of.. Ja, zo simpel werkt het vaak. En voor de rest kijken: kan ik het combineren? Vaak is het dan nog vrij saai. Wat ik dan vaak doe is.. Dan heb je bijvoorbeeld alle verhuisbewegingen in Nederland, maar ja, het is niet zo interessant om absolute aantallen te hebben. Dus zet je het af tegen de bevolkingsomvang. Dan haal je zelf die cijfers erbij of soms doet het CBS dat al voor je. Dat is heel mooi, dan hoef je het zelf niet meer te doen. Maarre, dat doe ik ook wel met Europese onderwerpen. Je weet gewoon: wat het goed doet in het nieuws is een vergelijking van Nederland met andere landen, Belgie ofzo. Vaak heb je gewoon een rijtje met cijfers van de Europese Unie, maar zet het gewoon eens af tegen bevolkingsomvang. Dan krijg je vaak hele andere inzichten: Eigenlijk doen we het best goed of Eigenlijk doen we het helemaal niet zo goed. Zo doe ik het nu ook met de Olympische Spelen. Ik heb een hele dataset van alle winnaars. Nou, hoe heeft Nederland het gedaan met alle Olympische Spelen? En hoe doen de mannen het ten opzichte van de vrouwen? Dan gaan we dat soort vragen in de data inzichtelijk maken. Is gewoon een kwestie van sorteren, filteren en af en toe wat data toevoegen. En tegen de tijd dat je denkt: Dit is wel een verhaal, dan heb je al je data al. Kun je het zo naar het ANP doorschieten. Dus wat betreft het vinden van verhalen is het: je journalistieke instinct volgen, maar aan de andere kant zei je ook: als je gaat zoeken na een idee, werkt het niet zo goed. Ik doe het meestal dat ik data zoek en daar onderwerpen bij zoek. Maar het is niet een ding, je doet verschillende dingen door elkaar. Wat is dan bijvoorbeeld een onderwerp waar je echt trots op bent. Niet een groot project, maar een klein project waar het werken, het totstandkomingsproces heel goed ging?

105

NERD MET VIJF POTEN

MASTERSCRIPTIE JAN KRUIDHOF

Een groter project wat ik wel heel leuk vond om te doen, waren de stemmingen. Natuurlijk, je komt altijd problemen tegen, maar dat begon eigenlijk vorig jaar. Toen was er eens een hackathon geweest en leerde ik de mensen van Pollitics kennen, die al die stemmingen bijhouden. Toen hebben we afgesproken: het probleem waar zij tegen aanliepen was eigenlijk het coderen van al die stemmingen. Waar is nu precies over gestemd. Toen heb ik gezegd: ik wil jullie wel helpen daarbij. Vrijwilligersdag georganiseerd. Toen hebben we nog meer van die stemmingsdata gekregen en toen zijn we maar eens gaan kijken: wie stem nu met wie mee enzo? Toen het kabinet-Rutte viel was dat een mooi moment om erin te duiken. We hebben al die data gekregen, een ruwe analyse gemaakt. Kwamen we nog allemaal problemen tegen, dat de Tweede Kamer meer stemmingen had genoteerd dan wij hadden. Achteraan gegaan. Bleek dat de hamerstukken, dat wij die niet hadden, want die worden in de commissievergadering behandeld en niet in de plenaire zitting. Dus uiteindelijk hebben we besloten: we nemen de hamerstukken niet mee. Hoe ontstaat het precies? Met zon hackathon? Ja, dat is hoe wij werken. Daarom werken we ook zo goedkoop. We maken veel gebruik van vrijwilligers bij dit soort dingen. Ik ben ook altijd op zoek naar NGOs die veel bezig zijn met een bepaald onderwerp. Dan willen wij wel helpen, als we ook nieuwswaardige data krijgen. Maar NRC Handelsblad laat dat ook doen. Het verschil is dat wij ook echt meehelpen. Want dat merk ik wel: heel veel onderzoekers hebben vaak prachtige data, waar je ook journalistiek echt wat leuks mee kan doen, maar die voelen zich gewoon een beetje genaaid door de grote kranten. Dan hebben ze twee dagen lang die data lopen crunchen en daar een mooi stukje over geschreven en dat wordt dan helemaal ingekort naar een klein stukje achterin de krant. We hebben wel een paar van dat soort onderzoekers gehad die zeiden: Met het NRC willen wij niet meer samenwerken. Wat wij doen is: we helpen ze gewoon mee. Ook met zon hackathon. We krijgen veel data, maar we vragen ook: zijn er nog dingen die jullie nodig hebben? Kunnen we het op een manier doen zodat jullie de data voor jullie onderzoek kunnen gebruiken? Je merkt dat dit heel veel goodwill kweekt. Maar die mensen zijn ook voor ons aan het werk dus ik vind dat er best iets tegenover mag staan. Waarin verschilt jullie werkwijze van andere journalisten? Ik denk dat wij wat meer verhaalgericht zijn en minder op visualisaties. Het is denk ik iets minder zichtbaar wat wij doen.

106

NERD MET VIJF POTEN

MASTERSCRIPTIE JAN KRUIDHOF

Hoe bedoel je minder zichtbaar? Nou, als RTL Nieuws met iets komt is dat beter zichtbaar. Onze spullen zijn ook all over the place, maar niet altijd op onze site. We hebben natuurlijk geen hoge bezoekersaantallen, dus het heeft wel minder impact. Maar we doen wel meer dan anderen. Soms heeft het regionaal wel degelijk impact. En er zijn ook een paar keer Kamervragen gesteld en onderzoeken ingelast naar aanleiding van stukken van ons. Plus: wij zijn een stichting, dus we werken veel samen met vrijwilligers. Crowdsourcing, dat soort dingen. Dat brengt risicos met zich mee, maar dat betekent wel dat je veel goedkoper kunt werken. En de risicos zijn dan? Betrouwbaarheid van mensen en daarmee de betrouwbaarheid van je data. Daar hebben we best wel problemen mee gehad. Maar ontdekte je dat wel op tijd? Jajaja, maar met dat cameraproject bijvoorbeeld. Dat hebben we met twintig vrijwilligers gedaan, die hebben gewobt. We werken ook heel veel samen met universitaire groepen overigens. Maar dat hebben we met vrijwilligers gedaan en die hebben gewobt en een aantal heeft dat gewoon niet goed gedaan. Je kan wel proberen het te begeleiden, maarre... Maar je had al een WOB klaargezet toch? Ja, dat is allemaal goed gegaan maar in het proces zijn er gewoon fouten gemaakt. Dat mensen termijnen hebben laten verlopen en dat soort dingen. Dat kan niet, dat is niet handig. Er zijn leges in rekening gebracht die nooit zijn betaald. Nu vind ik dat niet zo erg, maar daar hebben we ook nooit meer iets van gehoord. Maar daarmee loop je wel weer een financieel risico, dus dat is niet handig. Een probleem waar we op een gegeven moment tegen aan liepen, was dat wel alle WOB-stukken binnen waren, maar dat een aantal vrijwilligers gewoon uit beeld waren verdwenen. Die reageerden niet meer op mails en alles, maar die hadden de stukken nog wel. Dus ik heb echt met een advocaat moeten dreigen om die stukken terug te krijgen. Op een gegeven moment echt gezegd van: Jongens, woensdag wil ik die stukken hebben. Ik zat er echt al twee maanden achteraan en vaak gebeld enzo. Ik wil woensdag die stukken hebben, anders krijg je een advocaat achter je aan. En was het gewoon luiheid of iets anders?

107

NERD MET VIJF POTEN

MASTERSCRIPTIE JAN KRUIDHOF

Ja, mensen met een beetje persoonlijke problemen, denk ik. Ja, kan best zijn, maar we hebben wel een productie af te maken. Een groot project waar heel veel mensen heel veel tijd in hebben gestoken. Dan dreigt zoiets te mislukken. En die universitaire groepen? Ja, dat doen we ook heel veel. En zoek jij die zelf op? Ja, maar ze weten ons inmiddels ook aardig te vinden, maar voor zon hackathon ga ik overal de boer op om data los te krijgen van wetenschappers. Want die hebben vaak hele interessante dingen. Maar ook wel om hulp te vragen. Zij weten het beste wat die data kunnen, wat ze zijn, wat de zwaktes erin kunnen zijn. En ik wil ook graag dat ze er op zon hackathon ook zijn om mee te analyseren. Dat we geen fouten maken bijvoorbeeld. Zijn er buiten jullie om ook hackathons? Want je zei dat er ook andere zijn, maar ik ken alleen die van jullie. Ja, ze zijn er wel, maar niet nieuwsgericht. Wij doen hackathons rond nieuwsthemas. Dat is wel het verschil ja. Ik bedoel: Hack de Overheid doet ook hackathons. Waar wij ook wel naar toe gaan hoor en gaan kijken. Vaak hebben ze interessante data en worden er leuke dingen gemaakt. Het is ook goed voor je contacten in de programmeurswereld. Maarre, daar proberen we altijd wel bij te zijn. Maar wij doen het echt rond nieuwsthemas. En het is best veel werk om te doen. Maar het is wel heel erg leuk. Het verwerken, dan heb je het over Excel? Ja, het is verschillend, daar gebruik je allerlei programmas voor. Wat is jouw definitie van schone data? Data die klopt, waar geen dubbelingen in zitten, waar geen fouten in zitten. Een foutloze dataset bestaat niet. Dat is echt onmogelijk denk ik. Maar een dataset die op zon manier is gemaakt dat je ermee kant visualiseren, dat Google er wat mee kan, dat je er kaarten van kunt maken. Dat soort dingen. Daar kun je Excel voor gebruiken. Met Excel kom je een heel eind, daarmee kun je echt tachtig procent van het werk doen. Maar voor het echt zware werk heb je Google Refine nodig bijvoorbeeld. Zou wel handig zijn als je wat MySQL en dat soort dingen kent. Kan ik zelf niet, maar ik red het tot nu toe prima met Excel.

108

NERD MET VIJF POTEN

MASTERSCRIPTIE JAN KRUIDHOF

Google Refine en Excel is tot nu toe genoeg? Ja, voor mij wel. Maar als je echt zware bestandskoppelingen enzo wilt doen dan red je het daar niet mee. Dus daar hebben we echt programmeurs voor nodig. Dus ik hoop het allemaal nog wel te leren, maar dat heeft gewoon tijd nodig. En die tijd heb ik gewoon niet. Op het schoonmaken ga ik verder niet teveel in, want het kan zomaar zijn dat er, als ik dit klaar heb, weer een nieuw programma is.. Ja, ik denk dat bijvoorbeeld Jerry dat wel anders doet. Die heeft wel programmeerervaring. Programmeurs lachen me ook altijd uit als ik over Excel begin. Die vinden het helemaal niets, maar voor mij werkt het gewoon goed. Ik kan er goed mee overweg. Hoe zou je precies het verschil tussen verwerken en analyseren.. Je kan pas goed analyseren als je data goed zijn. Anders klopt je analyse niet. In Excel kan je al die dingen toch doen? Opschonen, verwerken en visualiseren? Merk je dan nog een duidelijk onderscheid van de ene stap in de volgende? Wat ik vaak doe is: ik begin in Excel, als het kan. Want Excel is gewoon goed en daar kun je echt veel mee. En vervolgens ga ik naar Google Docs, daar werk ik ook heel veel mee. En vanuit daaruit kun je aan visualisaties werken. Ik vind de visualisatietechnieken in Google Docs beter. Omdat ze interactief zijn en je kan er meer mee. Je kan niet alleen een lijngrafiekje of een kolommetjes maken, maar ook bewegende grafieken en scatter plots [puntenwolken, JK]. Dus je kan er ongelovelijk veel mee, met Google Docs. Plus: je kan ook heel makkelijk kaarten maken, met Fusion Tables. En daar kun je wel databases mergen [samenvoegen, JK]. Op basaal niveau kan ik dat ook wel. Als je bijvoorbeeld regionale data hebt over gemeenten, dan moet je dat gewoon in een kaartje zetten. Dan kun je bijvoorbeeld zien dat heel veel werkloosheid in het Oosten van het land zit. Dat haal je gewoon niet zo snel uit een tabel. Dat vertelt vaak meteen het verhaal. Plus: je gebruikt het toch later en dan heb je mooi een interactieve kaart op je site. Dus analyse en visualisatie komen dichtbij elkaar. Tenminste: bij ons. Dus het kan ook zijn dat als je aan het visualiseren bent ziet: daar zit het probleem. Ja, vaak ontdek je het dan. Dus dat je eerst een grafiek maakt en dan een trend ziet. En dan kun je vervolgens weer teruggaan naar het verwerken...

109

NERD MET VIJF POTEN

MASTERSCRIPTIE JAN KRUIDHOF

Ja, zeker hoor. Daar kom je later ook wel achter hoor, dat die dataverwerking zo ontzettend belangrijk is. Dat je het goed neerzet. Dat je stappen kunt herleiden. Dat als je ergens een fout maakt, dat je die fout kan herstellen zonder dat je al die stappen daarna opnieuw moet doen. Dat is wel prettig. Dus je moet Excel zo gebruiken dat als je ergens wat verandert, dat die analyse verandert. En die kaarten veranderen. Dat je die cellen aan elkaar linkt? Ja, veel formules gebruiken en die intact laten, want anders ga je honderd keer heen en weer. Dat kost heel veel tijd. Maar ja, dat is iets wat je al doende leert. (Somt samenwerkingsverbanden op. ) Bedrijven. Heb je dat ook weleens gedaan, bedrijven? Ja, soms. Of stichtingen, dat soort dingen. Laats hadden we een verhaal gemaakt over beschermde diersoorten in Nederland, waar die het meeste voorkomen. Ja, in Amsterdam kwamen die veel voor toch? Ja, maar dat was ook omdat hier veel stadsecologen actief zijn en die lopen veel te turven. Ja, dat vertekent het beeld, dus dat moet je wel weten. Is dat altijd voor-wat-hoort-wat met bedrijven en stichtingen? Nee hoor, soms vinden ze het gewoon leuk. Dan willen ze wel even genoemd worden, maar dat is logisch, dat je de bron aangeeft. Zie je daar als journalist nog dilemmas in? Ligt eraan, op welke voorwaarden je dat doet. Als je ze alleen hoeft te noemen vind ik dat geen punt. Niet meer dan normaal dat je de bron noemt, waar het vandaan komt. Maar ik ga geen reclame voor ze maken. Dat is gewoon een normaal journalistiek proces. Maar bedrijven vinden het vaak best leuk om mee te werken. TomTom bijvoorbeeld, dat is uiteindelijk niet doorgegaan, omdat ze het daar toch te bewerkelijk vonden, maar die konden zo laten zien waar in Nederland bijvoorbeeld veel te hard gereden wordt. Dat zijn wel hele leuke datasets. Maar het kost vaak veel tijd en uiteindelijk, als ze daar zelf achter komen, schrikken ze nog wel eens. Dan toch maar

110

NERD MET VIJF POTEN

MASTERSCRIPTIE JAN KRUIDHOF

niet. Zou je met ieder bedrijf kunnen of willen samenwerken? Ja, ach, ligt eraan. Ik moet wel weten waar de gegevens vandaan komen. Bij Nu hebben ze bijvoorbeeld wel editorials.. Ja, die hebben wij ook. Maar daar staat ook gewoon bij dat het een editorial is. Maar ook bijvoorbeeld met een bedrijf als Shell? Het bestuur zou zeggen: Nee, dat willen we niet. En ik zou zeggen: Ik heb er geen problemen mee. Van mij mag alles erop. Als zij ervoor betalen, prima. Het staat mijn redacteuren vrij om daar omheen alles te vragen wat ze willen, ook naar aanleiding van zoiets. Die stukken voor het ANP, hoeveel tijd nemen die in? Soms een half uur, soms een halve dag. En dan heb je het hele stuk af? Ja, maar ik hoef alleen de cijfers aan te leveren. Iemand anders gaat het nabellen. Er zijn dingen die ik echt in een kwartier heb gedaan. Dit is zo duidelijk, het verhaal wat hier in zit. Moet je wel mee uitkijken hoor, trouwens. Dat je niet te snel wilt gaan. Vaak zit er ook weer een verhaal achter de cijfers. Je moet wel een beetje weten waar je het over hebt. Sommige stukken ben ik bijna een dag mee bezig geweest. Maar die vond ik gewoon leuk en interessant om te doen. Probeer het toch wel een beetje body te geven. Dat het wel ergens over gaat. Wat doe je eigenlijk nog na publicatie? Vul je dingen aan? Ja, nou, soms, meestal niet zo. Vaak geen tijd meer voor. We hebben wel van die lopende series, over de wereldtemperatuur en de olieprijzen. Daar hebben we maandelijks een update van. Dat zien we wel in de bezoekersstatistieken terug dat die echt als referentie worden gebruikt. Dat zijn de twee dingen die we dan structureel doen. Het is wel de bedoeling.. We zitten er wel aan te denken, dat gaat de UvA [Universiteit van Amsterdam, jk] misschien voor ons bouwen, om uit die Haagse Twitterstolp een ranglijst te maken wie nou populair is op Twitter, wie niet. Maar voor de rest.. Nee, het is gewoon verhaalgedreven. Het verhaal is af en dan heb je nog de discussie eronder. Daar voeg ik nog weleens dingen toe, als mensen vragen hebben. Of dat ik wat

111

NERD MET VIJF POTEN

MASTERSCRIPTIE JAN KRUIDHOF

dingen aanpas of verduidelijk. Dat is wel het voordeel van een blog. Dus ik probeer me wel altijd met de discussie te bemoeien. En als er vragen zijn, die te beantwoorden. Maar verder, nee. Dus dan is het na een paar dagen wel afgelopen? Soms, als een onderwerp een half jaar later weer in het nieuws is, dan wijzen we er nog weleens op: We hebben toen dit geschreven. Wat mij ook nog opviel: soms vallen jullie met een artikel met de deur in huis. Soms zit er een afbeelding bij. Soms is het gewoon alleen de data. Hebben jullie daar over nagedacht: We willen heel vrij kunnen werken of gaan jullie het wel meer een standaardaanpak ontwikkelen? Ja, dat gaan we wel doen hoor. Het is nu nog een beetje een zooitje. Komt ook omdat ik niet de enige ben die die datadingen doet. Stephan [Ockhuijsen, jk] is er ook heel actief in. We hebben wat andere bloggers die heel handig zijn met data - dat is ook een van de redenen dat wij uberhaupt in de data zijn gestapt. We zijn nu wel bezig om te kijken.. We hebben wel een zoektocht: Welk visualisatieprogramma gaan we gebruiken? Dat we daar wat meer uniformiteit in krijgen. Als we een grafiek hebben, dat we gewoon een uniforme grafiek hebben. DataWrap hebben we gebruikt, maar daar zijn we niet tevreden over. Excel vind ik eigenlijk niet mooi. Google Charts werkt niet altijd even goed. Dus ik heb nu de programmeur die we hebben opdracht gegeven om een aantal templates [sjablonen, jk] te bouwen en een JAVA-library zodat we in ieder geval een uniforme manier van presenteren gaan krijgen. Waarop duidelijk staat dat het van ons is en dat er een huisstijl komt, voor de nieuwe site dan. Dat we allemaal op dezelfde manier onze data presenteren. We zullen ook wat meer uniformer gaan werken.. Ik wil op een gegeven moment af van tabellen en dat soort dingen op de voorpagina. Dat moet gewoon naar doorlink komen allemaal. Ik merk gewoon dat mensen er niet op klikken als er grafiek boven staat, dat vinden ze saai. Meer verhalend werken. Of het moet iets heel moois zijn, een mooie visualisatie die we hebben. Die meteen op de voorpagina gaat. Dus daar zijn we nu mee bezig, om meer uniformiteit te krijgen. Maar dat geldt eigenlijk voor de hele site. De kwaliteit wat omhoog, wat uniformer allemaal. Jullie hadden laatst een grappige wedstrijdanalyse van de wedstrijd Nederland-Denemarken. Zou dat dan ook nog steeds kunnen, een minder serieus stukje? Ja, je moet ook een beetje leuke dingen doen. Stephan heeft laatst ook gekeken naar de gemiddelde lengte van mensen en de hoogte van de doelpalen. Eigenlijk kwam hij tot de

112

NERD MET VIJF POTEN

MASTERSCRIPTIE JAN KRUIDHOF

conclusie dat de doelpalen hoger moeten, omdat mensen zo gegroeid zijn, de afgelopen honderd jaar. En dat de doelpalen niet mee zijn gegroeid. Ik heb ook een stuk geschreven over de routines en daarin stellen mensen dat iedere standaard die je jezelf oplegt invloed heeft op het journalistieke product. Dat is wel zo, want, jawel, het bepaalt wel een beetje hoe je werkt. Ook met die data van de dag, van het ANP: het ANP heeft andere stukken dan wij. Ik schrijf het heel anders op,veel luchtiger. Veel persoonlijker. Ik merkte ook, toen Laura er nog zat, die plaatste vaak die stukken een-opeen door. A) Daarmee onderscheid je jezelf niet, want dat stuk staat al overal. Het is niet duidelijk dat het van ons komt. Maar B) Het past ook niet zo goed op ons blog, zon heel feitelijk, klein, droog nieuwsstukje. Dus ik probeer altijd wel een eigen draai aan die stukken te geven. En als ik dan passages gebruik die ANP heeft nagebeld, dan breng ik dat ook niet alsof het van mij is. Maar ik zeg: Onze collegas van het ANP, enzovoort. Dus ik probeer daar wel een eigen draai aan te geven, dat iets wel bij onze stijl past. Dat ik het wat luchtiger op schrijf of.. Ik heb nu zon stukje, dat wordt niet door het ANP opgepakt, maar ik vond het wel leuk om er toch op Sargasso wat aandacht aan te besteden. Over depressieve gevoelens bij mannen en vrouwen in het afgelopen jaar. Er is laatst onderzoek geweest van het CBS en daaruit blijkt dat vrouwen depressiever zijn dan mannen, eigenlijk structureel veel depressiever zijn dan mannen. Dan denk mensen toch: Hoe komt dat dan? En dan weet je nu al dat het een mooie discussie kan gaan opleveren, kun je een beetje lopen stoken. Kijk, het ANP kan zoiets niet, die moet gewoon heel feitelijk doen, maar voor een blog is dat prima, daar kun je ook een beetje lol mee hebben. Alexander zei al dat ik van de verschillende aanpak goed de voor- en nadelen moest vragen. Maar als ik het goed begrijp zijn de voordelen van werken met vrijwilligers dus dat ze goedkoop zijn en.. ..dat ze een bepaalde expertise met zich meebrengen die journalisten niet hebben. Er zijn echt vrijwilligers die echt heel veel verstand hebben van iets en ook een enorme drive hebben om iets te doen. Zoals laatst ook met dat cameraproject, daar zat ook een programmeur bij die vrijwilligers. Rijkswaterstaat, die zat gewoon te traineren. Daarvan kreeg ik wel een lijst met al hun cameras, maar dan heel erg opgeknipt en daar konden we niets mee gewoon. Normaal gesproken moet je dat dan handmatig doen, maar die man maakt even een scriptje en die trekt alles er zo uit. Die zet dat gewoon goed neer op een kaart. Ja dat is super. Dat soort mensen heb je op een redactie gewoon niet rondlopen. Wat dat betreft zijn die vrijwilligers dus wel handig.

113

NERD MET VIJF POTEN

MASTERSCRIPTIE JAN KRUIDHOF

Ik denk, als je dit goed wilt doen, op een grote redactie, dan moet je en een journalist neerzetten - zoals ik, die wel iets van techniek begrijpt - en daarnaast moet je gewoon een keiharde programmeur erbij hebben. Die gewoon dingen kan maken, scrapen, dat soort dingen kan doen. Ik was laatst bij Altijd Wat, van de NCRV, die hebben ook een datajournalist aangenomen inmiddels. Ik zag die vacature en toen heb ik ook gezegd: jullie zoeken de verkeerde persoon. Jullie moeten een programmeur hebben en niet een journalist, die hebben jullie zelf wel. Er lopen daar genoeg journalisten rond. Maar ja, ze hebben niet geluisterd. En er komt ook niets uit nu, geloof ik. Maar jullie werken nog wel met ze samen toch? Ja, maar dat project is een beetje.. [bootst leeglopende ballon na]. Volgens mij hebben ze er niet zoveel zin in. Ik zou ze eigenlijk adviseren over een hele grote productie. Plan voor ze geschreven enzo, maar ze pakken het maar niet op. Nee, je ziet veel mislukken hoor, ook bij RTL gaat het mis. Maar als ik contact met hun opneem, denk je dat ze daar uberhaupt nog iemand hebben die er wat over kan vertellen? Andr Tak, die gaat erover. Nu ja, ze hebben Jelle eruit gezet en volgens mij hebben ze verder niet zoveel mensen die dat kunnen. Ik weet het niet. Aan de hand van welke criteria maken jullie keuzes. Je zei al: tijd speelt een rol, je kan wel met een vraag beginnen, maar dat is tijdrovend. Anderzijds hebben jullie ook de luxe om soms te tijd voor iets te nemen. Soms wel ja, als je iets belangrijks hebt, maak je graag tijd daarvoor vrij. Over jezelf nog even: wanneer was het eerste moment dat je met datajournalistiek in aanraking kwam? Mmm.. dat is nog niet zo lang geleden hoor, anderhalf jaar denk ik, twee jaar geleden. Toen ik in New York woonde. Daar speelde het al wel. Daar zag ik dat kranten ermee bezig waren en in Nederland begon er toen net een beetje over gepraat te worden. Met Sargasso deden we af en toe wel van die dataprojectjes enzo. En heb je ook een journalistieke opleiding gedaan?

114

NERD MET VIJF POTEN

MASTERSCRIPTIE JAN KRUIDHOF

Ik heb geschiedenis gestudeerd, ook, in Utrecht. En daarna bij het Utrechts Nieuwsblad terecht gekomen, als trainee van het Wegener-klasje. Gewoon algemene verslaggeverij gedaan op de regioredacties enzo en daar het vak geleerd. En daarna al vrij snel richting onderzoeksjournalistiek gegaan, de zwaardere dingen enzo. Dat werd het AD, toen ben ik naar de Amersfoortse Courant gegaan, vooral onderzoeksjournalistiek gedaan. Grote verhalen, moorden, dat soort dingen. Toen ben ik daar gillend weggelopen. Waarom? Dat is een vreselijke krant, het AD. Stel proleten bij elkaar. Vreselijke sfeer, gewoon geen ruimte meer voor goede journalistieke producties. Moet allemaal snel en vooral niet te ingewikkeld. Toen had ik het vrij snel gezien en ben ik voor mezelf begonnen. In Maastricht gaan wonen en toen ben ik vrij snel bij het NRC Handelsblad terecht gekomen op de redactie onderzoeksjournalistiek. Daar een half jaar meegedraaid ter vervanging van iemand en daarna mocht ik een tijdje blijven. Daarna gaan freelancen en vooral voor het NRC en Intermediair. Voor NRC veel voor het zaterdags bijvoegsel. Toen naar New York gegaan, correspondentenwerk. Boek geschreven. Sinds vorig jaar weer terug en toen ben ik Sargasso gaan doen. En in Amerika heb ik ook het businessmodel voor Sargasso uitgewerkt en een deal met het ANP geregeld en ander geld geregeld. En heb jij het datawerk jezelf aangeleerd of van Laura..? Nou, Laura was zelf ook nog niet zo technisch onderlegt hoor, toen ze hier begon. Dus we hebben het echt een beetje strompelend moeten leren. En met enige bluf wel bij het ANP binnengekomen, moet ik zeggen. Haha, maar het is wel goed gegaan. Maar we hebben gewoon on-the-spot geleerd. En wat ik zeg, als je goed Excel kan, kan je al een hele hoop. Ik heb er wel tijd voor genomen om me dat eigen te maken. Dus al doende leer je wel. Het is allemaal niet zo ingewikkeld, het valt echt wel mee. Datajournalistiek is moeilijk, dat durf ik echt wel te zeggen. Omdat je heel veel combineert, goed met data, wat zegt die data nou, je moet data kunnen lezen, het is gewoon echt journalistiek werk, plus de technische component die eraan vast zit. Ik vind het wel ingewikkeld vaak, maar op zich, die vaardigheden op zich zijn wel te leren, daar hoef je geen keiharde programmeur voor te zijn. Wat was de werkverdeling toen? Laura zat toen drie dagen per week bij het ANP, ook echt op de redactie. Als aanspreekpunt ook, dat is ook belangrijk. Want uiteindelijk is het de bedoeling dat ze het bij het ANP zelf doen.

115

NERD MET VIJF POTEN

MASTERSCRIPTIE JAN KRUIDHOF

Kennisoverdracht. Ik adviseer het ANP ook hoe ze dat in hun redactioneel proces moeten onderbrengen. Ik deed dan de wat grotere producties, de hackathons, de contacten met NGOs en universiteiten. Dat soort dingen deed ik vooral. Dus dat werkte op zich wel goed, goede onderverdeling. Ik haalde data vaak binnen, praatte ik los overal en zij ging ermee aan de slag. Nu doe ik eigenlijk alles en dat blijf ik ook doen. Die redacteur komt straks echt alleen voor het blog. Ik doe echt puur de datajournalistiek en de WOB-projecten. En Excel, daar was je tot een paar jaar geleden ook echt niet superhandig mee? Nee nee, daar heeft mijn vrouw mij het afgelopen jaar veel bij moeten helpen. Zij is gewoon goed met data, zij is wetenschapper, neurowetenschapper, dus ze moet veel data analyseren. Heb je jullie aanpak nog van iemand afgekeken? Mwoh, iedereen kijkt natuurlijk wat The Guardian doet, maar bij ons was het wel anders omdat wij echt nieuws moeten genereren. Dat hebben we echt zelf moeten leren. Voor de rest kijk je natuurlijk wel wat anderen doen, het is een klein wereldje dus je deelt veel, overlegt veel. Er zijn maar een paar in Nederland die het doen. Dus daar zijn contacten mee. Als je nu opnieuw zou beginnen, zou je het dan anders hebben aangepakt? Nou, wel anders dan we toen waren begonnen ja. Meer vanuit de data werken. Niet alleen maar ingewikkelde dingen doen, maar ook hele simpele dingen. Die moet je ook doen, anders word je gek. Gewoon van die dagelijkse stukjes, ik denk dat dat wel heel goed is. Dat is echt geen verheven datajournalistiek waarbij je hele ingewikkelde dingen doet, maar het is wel goed om in contact te blijven met die data, te weten wat er is. En je haalt er toch vaak ook nog een nieuwtje uit. Wat betreft de rest van de organisatie. Wat is de werkwijze van Sargasso? Dat is ingewikkeld hoor. [Grinnikt] Omdat we zoveel samenwerken is het echt lastig. Het ANP heeft een hele andere. Maar los van de datajournalistieke tak? Ok. Nou, we hebben een stichting, daaronder een kleine redactie, daaronder een flink reservoir aan vrijwilligers. Het is in principe een vrijwilligersorganisatie. En ik ben dan baas van de site en moet aan het bestuur verantwoording afleggen.

116

NERD MET VIJF POTEN

MASTERSCRIPTIE JAN KRUIDHOF

En hoe beinvloedt hoe de rest van Sargasso werkt jullie datajournalistiek werk? Dat is een moeilijk punt soms. Het is altijd lastig als in een vrijwilligersorganisatie opeens geld komt en professionele krachten en die ook meer professionele eisen gaan stellen. En we werken steeds meer met professionele klanten. Het ANP en Nieuwsuur zijn we nu mee bezig. Dan loop je wel tegen de reputatie van een blog aan en gaan klanten op een blog kijken. Het is niet altijd even goed wat er staat. Dus dat is wel een probleem waar we tegenaan beginnen te lopen nu. Het blijft schipperen: tot hoever ben je een professionele organisatie en tot hoever ben je een vrijwilligersorganisatie. Komen andere redacteurs ook met ideeen? Ja, soms met hele goede hoor. Echt leuke dingen. Laatst heeft iemand gekeken naar het spoorboekje en hoeveel je nou betaalt per reistijd. Bleek dat het traject Den Haag - Amsterdam eigenlijk buitensporig duur is. Terwijl je volgens de nieuwe regeling er alleen maar langer over doet en meer gaat betalen. Dat soort dingen. Is er nog iets dat je zelf kwijt wilt? Ehm.. Nou, wat ik wel kan zeggen: als je de komende tijd verzekert wilt zijn van werk, duik dan in de datajournalistiek. Dat is wel een goede markt op dit moment. Maar voor de rest, nee. Het is een hoop poeha, die datajournalistiek. Maar het is gewoon journalistiek.

117

NERD MET VIJF POTEN

MASTERSCRIPTIE JAN KRUIDHOF

Arlen Poort (NRC Handelsblad) en Laura Wismans (nrc.next)

Allereerst, jullie doelstelling. Welk doel hebben jullie voor ogen als jullie bezig zijn met datajournalistiek? A: Ik vind dat heel moeilijk te beantwoorden, wat het doel.. Je kunt iets zeggen over het doel van je journalistiek. En dat is, als je het heel hoogdravend zegt, zorgen dat mensen beslissingen kunnen nemen die de maatschappij misschien ten goede komen. Het gaat om waar geven ze hun geld aan uit, maar ook waarop gaan ze stemmen, welke culturele voorstellingen gaan ze bekijken? Dat is een idealistisch idee. Je kunt ook zeggen: journalistiek dient, als je het zou vergelijken met de Tweede Wereldoorlog.. L: Haha, tien minuten zitten we erin.. A: Haha, nee.. Maar dat mensen nooit kunnen zeggen: Ik wist dat niet, ik wist niet dat het zo erg was, ik wist niet dat dit speelde. Gewoon het heel goed informeren van mensen. Dat ze op de hoogte zijn van alles wat relevant is. Maar ja, als je het toepast op datajournalistiek. Ja.. L. Ik denk niet dat het anders is dan normale journalistiek. A: Nee, maar het blijft heel erg hoogdravend. Het is niet zo dat je elke dag als je hier komt, je pakt een kopje koffie en je stelt je de vraag: Wat is mijn doel vandaag? Maar hebben jullie wel een doelstelling meegekregen? Dat de data wel een beetje spannend moet zijn bijvoorbeeld? Worden jullie gepusht om het een beetje vlot te houden of is het doel dat er belangrijke dingen.. L: Het moet nieuwswaardig zijn, moet ergens een trend in zitten of een ontwikkeling of een onverwacht iets. Dan is het de moeite van het beschrijven waard. Iets wat iedereen al weet, wat iedereen verwacht, ook al is het data - dan is het niet zo spannend om op te schrijven. Maar dat is eigenlijk nooit zo, er gebeurt altijd wel iets in cijfers. Zeker hoe groter de datasets, hoe spannender het is, meestal. A: En als je kijkt naar - dat was dan niet echt datajournalistiek en ook heb ik het niet gedaan maar vorig jaar was er een artikel, dat stond eerst in next, ongeveer een jaar geleden, over

118

NERD MET VIJF POTEN

MASTERSCRIPTIE JAN KRUIDHOF

vrouwenoverschotten in de jongere leeftijd - twintigers, dertigers - in Amsterdam. Omdat het kennelijk zo is dat vrouwen liever in de stad wonen dan mannen. Dat is demografie, demografie kun je saai noemen. Maar als je het toepasselijk opschrijft - ik weet even niet meer wie dat opschreef, dat was een freelancer - maar het was een heel leuk onderwerp, omdat er wel een soort van probleem werd benoemt: Er zijn vrouwen die een man zoeken en een kind willen krijgen, maar die mannen komen ze niet meer tegen, want die wonen niet meer in de stad. Het ligt er dus maar net aan.. Volgens mij is het qua spannendheid.. Kijk, wij zijn ook maar gewone mensen met gewone interesses. Toevallig werk je bij een krant en doe je dingen met informatie, maar saaie informatie, daar zitten hele interessante achtergronden bij. Dat is puur het sekseverschil, als je dat als definitie in een databestand leest, denk je: Zal wel... Maar als je daar de vraag bij stelt en goh, dat zou wel eens een interessant onderwerp kunnen zijn, dan kom je bij een onderwerp uit dat iedereen wil lezen. Heel veel mensen hadden het daar over. L: Datajournalistiek is nooit alleen de cijfers beschrijven. Dat is altijd het verhaal daarachter: wat betekent dat dan en voor wie heeft het invloed? Dat is ook wel een groot verschil. Datajournalistiek is lang niet alleen cijfers. Dat is ook nog wel een discussie onder datajournalisten zelf: alleen een dataset, zou dat voor jullie ook voldoende zijn? Iets waar je als lezers doorheen kan scrollen? A: Ligt eraan. Die kaart van CBS-gegevens, die ik in februari online heb gezet. Dat is eigenlijk precies dat. In de krant heeft een stuk gestaan en op de website stond er ook een wat kleiner stuk. Meer om het wat body te geven. Maar eigenlijk, die interactieve kaart was het gewoon. Maar het ligt heel erg aan de manier van presenteren. Soms zie ik in Amerika voorbeelden en daar moet je door en door en door blijven klikken. Je moet de bezoeker van je website, want heel vaak zijn het dan interactieve dingen, niet een taak geven. Het gaat erom.. Kijk, een landkaart iedereen kent landkaarten. Sinds Google Maps bestaat kan iedereen met die interface omgaan. Als je daar iets op legt wat een nieuwe dimensie geeft aan de werkelijkheid, dan heb je daar op zich al genoeg aan. Dat was die CBS-postcodedemografiekaart eigenlijk. Dat gaf voor het eerst inzicht in de omgeving van hoe mensen wonen. Wat hun stad of buurt is. L: Maar daar hoor wel bij: wat is er opvallend aan voor heel het land? Of voor heel het ding dat je beschrijft. De service daarbij is, dat mensen hun eigen vierkante kilometer kunnen bekijken. Ik vind wel dat journalistiek altijd het verhaal moet vertellen en niet alleen het neerplempen en succes ermee.

119

NERD MET VIJF POTEN

MASTERSCRIPTIE JAN KRUIDHOF

A: Nee, dat is waar. En hierbij heb ik ook wel geprobeerd een paar opmerkelijke dingen in Nederland te laten zien, maar ja. Iets wat zo gedetailleerd is. Bovendien: deze dataset had ook geen ontwikkeling. Dit was gewoon dit jaar, dat was het dan. Je kon ook niet zeggen: daar is iets gegroeid of zoiets. Ja, ik heb heel veel wijken - ik heb die hele kaart zon beetje bekeken. Maar dan nog: je kunt niet in je eentje heel Nederland af gaan, elke straat van Nederland. Er zijn een paar dingen die ik opmerkelijk vond, maar er zijn nog duizend andere opmerkelijke dingen op die kaart te vinden die ik ook niet gezien heb. L: Dat willen lezers wel graag. Dat merk je wel, daar heb ik zelf een scriptie over geschreven, dat de aandacht van mensen er wel lang bij blijft als ze zichzelf kunnen opzoeken. A: Maar het moet wel makkelijk, mensen moeten niet voor een taak gesteld worden. Het moet wel een ontdekkingstocht zijn, zonder dat er een hoge drempel is. De nieuwsgierigheid moet van zichzelf blijken. Je moet niet eerst twintig keer moeten klikken en nadenken waar je naartoe gaat om te weten wat het verhaal is. Hebben jullie ook het doel om het allemaal online te zetten of in de krant te houden? Of kies je wat makkelijk is voor het verhaal? A: Nou ja, het is lastig. Ik ben in principe voor open data: overheidsinformatie moet openbaar zijn. Als je het weer over die CBS-kaart hebt. Het databestand erachter is gewoon een enorm grote tabel van het CBS. Dat is een Excelsheet, maar dan heel groot. Ik heb daar een visualisatie van gemaakt. Dat is mijn werk. En dat ga ik niet weggeven. Door die kleurtjes enzo, dat is allemaal van mij. Het staat op het web, maar mensen kunnen dat niet.. Nou ja, je kunt wel een script schrijven om die data daar weer uit te genereren, maar het is niet dat je het weggeeft. Dat blijft op onze site staat, niemand anders kan er wat mee doen. Dat zou ik nooit zomaar weggeven. Aan de andere kant: dat was een beetje een moeilijk verhaal met die stembureaukaart. Die ga ik ook in september weer maken. Die we in juni 2010 hebben gemaakt. Het lastige daarbij was: ik wilde het wel online zetten.. Het databestand zelf bevatte alleen maar de naam en het nummer van een stembureau per gemeente. Dus: Basisschool de Paperclip in Enschede of zoiets. Maar je weet niet wr die zit. Maar iemand anders, een hobbyist zou je kunnen zeggen, die ook wetenschapper aan de TU Twente is, die had zelf iets van 80 uur achter de computer gezeten om van alle stembureaus in Nederland het adres op te zoeken. Dan wist je niet alleen dat dat Basisschool de Paperclip was, maar ook aan Grote Markt nummer zoveel in

120

NERD MET VIJF POTEN

MASTERSCRIPTIE JAN KRUIDHOF

Enschede. Nu.. Wij hebben samengewerkt, dus hij heeft ons die adressen gegeven en ik heb hem weer met andere dingen geholpen. En hij verdiende er geld mee om die dataset te verkopen. Dus ik had op zich wel die dataset online willen zetten - van: download die hele lijst maar en ga er wat mee doen - maar ja, hij had daar wel 80 uur op een zolderkamertje aan zitten werken. Dat ga je niet zomaar doen. Dus dat was meer dat je iemand anders werk beschermt, dat je het niet op een andere manier downloadbaar op de website zet. Dus waar het kan, waar jullie de mogelijkheid hebben maken jullie het zo openlijk mogelijk en dat doen jullie alleen niet als er een beperking is? Het heeft er ook een beetje mee te maken hoeveel werk je er zelf in hebt gestoken. En ga je nou echt de concurrent helpen door je werk weg te geven. Ehm, daarin moet je denken bijna een commercile afweging maken. L: Er zit ook wel verschil denk ik tussen de data weggeven en het hele werk weggeven, inclusief presentatie en verhaal. Het is juist wel vleiend als iedereen het erover heeft en linkjes naar jouw kaart staan. Dat is prima en daar wordt iedereen ook wel blij van. Maar op het moment dat mensen zelf die kaart daar neer zouden zetten, dan wordt het minder leuk. Maar die data daarachter, mochten zij er een andere toepassing van maken.. Dat is een beetje de filosofie van open data, als zij daar iets anders mee willen is dat leuk. Maar ja, mocht er een copyright van iemand anders op zitten, dan is dat natuurlijk niet aan de orde. Ik heb ook best wel vaak gehad.. Dat vond ik zelf een heel leuk onderwerp, over beschermde diersoorten in eh.. ..in Amsterdam? L: Ja, daar ging het verhaal uiteindelijk over, maar we hadden het voor elke gemeente in Nederland. Superleuk om daar eens inzicht in te krijgen en daar hadden we ook leuke kaarten bij gemaakt. Maar ja, die dat die erachter zat konden we dan weer niet delen, want die is van iemand anders. Maar ja, mensen kunnen wel het kaartje bekijken, want op geaggregeerd niveau mochten ze dat overnemen. Ja, dat zijn dan weer.. Meestal zijn het toch wel commercile afwegingen, denk ik. A: Het heeft ook iets te maken met.. Ik kan niet een concreet voorbeeld bedenken.. Je kunt een dataset krijgen met veel vuiligheid erin. Ik weet niet of je daar bekend mee bent? Dat meneer De Boer aangeduid staat als Boer, de en De Boer en daardoor per ongeluk

121

NERD MET VIJF POTEN

MASTERSCRIPTIE JAN KRUIDHOF

dubbel geteld kan worden? A: Een goed voorbeeld is trouwens de lintjesregen. Dat is een beetje een knullig voorbeeld, maar onze lezers zijn daar gek op. Dus elk jaar doe ik dat weer. En dit jaar is het iets veranderd. Maar hiervoor was het altijd: dan kreeg je een Word-bestand met.. Elke regel was dan een naam, en dat was dan wel F.J. de Boer uit Waddinxveen, maar de indeling was niet altijd hetzelfde. Soms was het ook F.J. de Boer en dan stond daarachter Koster van de St. Mariakerk te Waddinxveen, wonende aldaar. Als je dat leest denk je: lijkt allemaal hetzelfde, maar als je het in een Excelsheet wil zeggen, moet je heel veel dingen anders gaan ombouwen, zodat het gestructureerde data zijn. Maar dat lijstje zette ik wel gewoon als een Excel-document op de website. Daar heb ik een volle dag steeds weer aan moeten besteden om dat goed te kneden, omdat je dat bijna allemaal met de hand moet doen. L: Het leuke is, dat iedereen dat bijna doet. Want hetzelfde hebben wij bij het ANP gehad, haha. Dat is zo zonde werk. A: Ja, dat is echt onzin. En uiteindelijk had ik, helemaal lullig.. Ken je Google Refine? Dat was nu ongeveer anderhalf jaar uit. Toen heb ik mezelf dat aangeleerd omdat ik bij de VVOJ een cursus gaf in Google Refine. Toen dacht ik: Nou, als ik nou als praktijkvoorbeeld te lintjesregen doe, dan kan ik die hele Refine zo programmeren dat ik er iets aan heb dit jaar. Komen ze dit jaar met een hele andere lijst! Was het allemaal onzin. Uren aan besteed, maar dat was allemaal niet meer nodig. Maar dat terzijde. Maar goed, daar besteed je dan een dag aan. Maar dat geef je eigenlijk weg als service. Het is niet zo dat.. Een jaar daarna heeft het geen commercile waarde meer ofzo. Dat geef je dan maar weg voor de hobbyist die er misschien iets anders mee wil doen. L: Je kunt kijken of er in Waddinxveen misschien extra veel lintjes worden uitgedeeld. A: Precies, dat soort dingen. Ik vind het niet zo erg om dat soort dingen weg te geven. Dat vind ik service. L: Vind ik ook een beetje bij de filosofie van open data horen. Dan het thema Onderwerpen. Hoe komen jullie over het algemeen aan jullie onderwerpen? A: Eh..

122

NERD MET VIJF POTEN

MASTERSCRIPTIE JAN KRUIDHOF

Kiezen jullie ze zelf? Komen mensen vanuit de redactie naar jullie toe met ideeen? A: Meestal kiezen we ze zelf. L: Ook wel, als je weet dat de verkiezingen er aan komen, dan ga je nadenken: Wat kunnen we met de verkiezingen doen? Want je weet dat die behoefte er is. Dat werkt ook weer een beetje twee kanten op. Soms vraagt iemand zich iets af of, wat ik heel erg hoop: mensen komen natuurlijk best wel databestanden tegen, maar daar doen ze nooit wat mee. En ik hoop dat de bewustwording wat groter wordt. Dat ze denken: He, daar zit wat in, laat ik het doorsturen. Maar die stroom is nog niet echt op gang gekomen. A: Ik heb eerder dit jaar voor alleen de binnenlandredactie, dat waren toen aanwezig misschien vijftien mensen, een wat ze dan een masterclass noemen gegeven. Ik heb ze ook heel veel voorbeelden laten zien van bestanden die je tegen kunt komen als journalist, waar nieuws in zit, maar wat niemand in de gaten heeft, omdat ze niet weten wat ze ermee moeten. En echt geprobeerd om dat helemaal zo te doen zodat mensen daarna dachten van: Goh, er misschien een rapport verschenen, maar daar zit dat nog achter en wat erachter zit is nog veel interessanter. Maar het komt niet echt. Maar zie je zon zaal dan echt voor je zitten, terwijl ze met grote ogen denken: Waar heb je het over? A: Nee, helemaal niet, want ik heb heel veel voorbeelden genoemd. Vaak uit van Amerikaanse kranten, omdat die het makkelijks te vinden zijn op het web. Bijvoorbeeld een onderzoek, dat ging naar een soort Amerikaans equivalent van de Cito-toetsen. Maar dan op de middelbare school. Ik weet niet precies hoe dat nou zat hoor. Maar een krant in Amerika had alle resultaten van heel Amerika uitgezocht en toen gekeken: Zijn er nou scholen waar de uitkomsten niet waar kunnen zijn? Gewoon een statistische berekening op losgelaten, van: hebben de scholieren van deze ene school nu significant anders gescoord dan een willekeurige andere school? Daar kwamen uitkomsten uit waaruit bleek: dit moet wel vuil spel zijn. Het was niet helemaal bewezen, maar er werden gewoon verdachte scholen aangewezen. Beetje Diederik Stapel-achtig, dat de leraar de toetsen voormaakte of zoiets. Dat voorbeeld geef je dan in de hoop dat de onderwijsredacteur misschien ook denkt van: Goh, dat kunnen we ook met Cito-toetsen doen of met eindexamenresultaten. In Amerika is toch veel meer data open. The Texas Tribune had van de oudste gevangene in de

123

NERD MET VIJF POTEN

MASTERSCRIPTIE JAN KRUIDHOF

staat zijn gewicht, zijn lengte, zijn naam, de reden waarvoor hij vast zat. Nu vraag ik mij bij de Cito al af: daar zullen mensen in Nederland vast over in opstand komen, als dat openbaar wordt gemaakt. A: Dat zou goed kunnen. Wat nu openbaar wordt gemaakt is alleen het gemiddelde Cito-cijfer per school. Maar wat je eigenlijk wilt weten, en dat kun je geanonimiseerd doen, is van scholier A tot en met Z: die heeft 500 gescoord, die heeft 100 gescoord, etcetera, zodat je een verdeling van alle scholieren krijgt. En daar hoef ik echt niet de namen bij te hebben. Het mooiste zou natuurlijk wel zijn als je de postcode van de scholier hebt, zodat je ook kan kijken.. L: ..uit welke buurt die komt. A: Ja, maar goed, dat wordt moeilijk. Maar als je alleen al de reeks scores hebt, dan heb je niemands privacy aangetast. Ik heb het nooit gevraagd, maar ik denk dat het a hell of a job gaat worden om dat te krijgen. En zie je daarin ook een trend, dat het makkelijker wordt? L: Ken je Hack de Overheid? Daar zit ik in het bestuur. En daarbij heb je open onderwijsdata, open cultuurdata, open zorgdata. En je merkt gewoon dat er veel meer over wordt gesproken. We gaan binnenkort - op 8 september - ook Apps voor Democratie organiseren, over de data van de Tweede Kamer. Er zit gewoon beweging in. Er wordt over gesproken. Gerdi Verbeet zet zich bijvoorbeeld persoonlijk in voor Apps voor Democratie, die gewoon ook mensen uitnodigt en met mensen uit het veld in gesprek wil gaan. Daaraan merk je: er zit wel beweging in. Ook de inspectie, als we het over Cito-scores hebben, ook daar wordt er over gesproken. Ze worden minder bang. Het wordt niet alleen maar gezien als supernegatief of ze willen ons er alleen maar mee aanvallen. Dat is natuurlijk ook helemaal niet.. Aan de ene zijn journalisten wel altijd op zoek naar schandalen, maar aan de andere kant is het ook heel logisch dat je als burger wilt weten hoe het zit met de scholen waar jou kind straks op gaat zitten. En dat besef komt wel steeds meer, denk ik. A: Het gekke is ook.. Als je als journalist op zoek bent naar schandalen heb je meer aan notulen enzo dan aan een databestand waar in feite alleen maar getallen in staan. Dat zijn geen schandalen, dat zijn alleen.. L: Fraude kun je er wel in zien. Ik mag hopen dat elke organisatie dat er ook uit wil halen. Dat

124

NERD MET VIJF POTEN

MASTERSCRIPTIE JAN KRUIDHOF

word je toch niet blij van, het is beter als dat er niet is. A: Ja, maar heel vaak gaat het juist puur om data die je puur servicegericht kunt gebruiken. Of demografisch om inzicht te geven in hoe een land verandert. Zitten helemaal geen schandalen in ofzo, is puur interessant. Dat is niet waar jullie op uit zijn, jullie zijn niet op zoek naar dirt? L: Ik ben bijvoorbeeld wel best lang bezig geweest met een verhaal over immigratiecijfers. Omdat er een heel groot verschil zat tussen de immigratiecijfers van het CBS en die van de IND, terwijl je zou denken: Zijn allebei vrij betrouwbare bronnen voor cijfers, ze hebben er niet echt baat bij om te liegen of weet ik veel wat. Maar immigratie is natuurlijk, zeker in het afgelopen kabinetsbeleid, een superheet hangijzer. Daar ga je dan wel extra in porren. En waar ik dan bijvoorbeeld achter kwam is dat er in de immigratiecijfers, heb je ongeveer voor gezinsmigratie, waar het voornamelijk over ging, elk jaar ongeveer 10.000 mensen die binnenkomen. Ik weet niet precies of die getallen kloppen. Maar 20 procent daarvan, ongeveer 2.000.. Nee, het waren 4.000 babys ongeveer. Dus gezinsmigratie ligt volgens mij tussen de 20.000 en 22.000 per jaar. En 4.000 daarvan zijn babys die in Nederland geboren worden. En dat betekent dus een heel groot verschil met hoe de IND telt. Namelijk: die babys hebben ook een verblijfsvergunning nodig en hoe het CBS telt, namelijk: mensen die zich opnieuw inschrijven in een gemeente, die eerder van buitenaf kwamen. Is helemaal niet raar, ik snap dat de IND.. Die moet die verblijfsvergunningen uitgeven, dus het is logisch dat zij die mensen tellen. Maar wat ik dan denk: ja, dan moeten ze dat in een aparte categorie tellen. Want op dit moment is het een heet hangijzer dat er zon tsunami van mensen naar ons land toekomt. Op twintig procent daarvan, van de gezinsmigranten, heeft dus geen enkel beleid invloed. Ja, dan ga je wel extra daarin porren, omdat je weet dat dit een mooi verhaal oplevert. Dus, als het erin zit dan haal je het er wel uit natuurlijk, haha. Nu je het zegt van immigratie.. Je merkt ook vaak, eigenlijk al vanaf het begin van datajournalistiek.. Als je kijkt naar Philip Meyer enzo, zijn het onderwerpen die te maken hebben met mensen die gediscrimineerd worden, zorg, immigratie enzo. Merken jullie bij jullie zelf ook vaak dat het vaak die kant op gaat? A: Ik denk dat dat komt omdat overheidsgegevens heel vaak hiermee te maken hebben. Het is heel mooi om onderzoek te doen naar boekhoudingen van bedrijven, maar je kunt bedrijven wel opbellen, maar die geven hun boekhouding toch niet. En juist datajournalistiek probeert veel

125

NERD MET VIJF POTEN

MASTERSCRIPTIE JAN KRUIDHOF

meer met kleinschalige data die in hele grote bestanden zit iets te doen. En je hebt wel via Datastream of Bloomberg allemaal macrocijfers en beurskoerzen van individuele bedrijven, maar heel weinig andere microdata, zoals het CBS dat noemt. En die heb je van de overheid natuurlijk wel. Dus ik denk dat eerder het verschil dat er andere onderwerpen naar boven komen. Puur de beschikbaarheid. L: Plus, aan de andere kant, ik zit niet zo diep in de economie. En daar zitten wel hele ingewikkelde rekenmodellen achter. Dus dat zegt mij niks, als ik naar zulke cijfers kijk. Dat is denk ik ook wel een verschil. En terwijl er heel van economieredacteuren zijn die ook wel naar cijfers kijken, want die zijn toch al een beetje.. Als ik een nieuw onderwerp ga bedenken, met een blank sheet, dan denk ik niet: Goh, laat ik eens iets economisch doen. Dat is bijna nooit zo. A: Een heel goed ding, wat eigenlijk al jaren zou kunnen, wat nooit iemand doet - ik ook niet, haha: alle prijzen, van alle supermarktartikelen staan gewoon online. Bijvoorbeeld op Albert.nl kun je gewoon van elk individueel potje pindakaas zien hoe duur het is. Je kunt dus zelf een scriptje schrijven om van week tot week de prijsontwikkeling van alles in de supermarkt te vinden. Dat is dan wel puur huishoudgerichte economie, maar daar kun je wel iets heel moois mee doen. L: Maar iedereen vindt het interessant, want iedereen doet boodschappen. En dat is wel het leuke. A: In die zin is het wel jammer dat de euro al is ingevoerd, want die discussie die we toen hadden van: Is alles nu duurder geworden? Als die euro nou over vijf jaar wordt ingevoerd kun je nu beginnen met al die prijzen. En dan tel je nog een paar jaar door en dan zeg je: Ja, het is wel zo of Het is niet zo. Is het bij jou trouwens net zo, dat je zegt: Ik heb geen voorkeur voor het economische? A: Iedereen heeft zijn interesses, maar het heeft er ook een beetje mee te maken: wat komt er op je pad. In die zin is journalistiek natuurlijk puur opportunistisch. Wat zijn je interesses dan vooral? A: Ik vind demografie zelf interessant. Ik vind dingen rondom verkiezingen interessant, maar eigenlijk alles wel. Het heeft er ook mee te maken.. Je kunt mij datajournalist noemen, maar

126

NERD MET VIJF POTEN

MASTERSCRIPTIE JAN KRUIDHOF

eigenlijk ben ik gewoon puur eindredacteur voor de binnenlandredactie. Ik heb op zich niet zoveel tijd om andere dingen te doen. Als ik dat wel zo hebben, zou ik ook met sport dingen doen. De Olympische Spelen komen eraan, je kunt heel veel statistiek doen. Er worden nergens zoveel rare statistieken over verzameld als over sportwedstrijden, daar kun je natuurlijk hele mooie dingen mee vergelijken. Ik kan zo gauw niet iets verzinnen. Zijn er nog meer onderwerpen waar je graag mee bezig zou willen, maar op een of andere manier komt het er niet van? A: Wat ik net noemde, prijzen van bijvoorbeeld Albert.nl. Gewoon niet aan toegekomen om daar iets mee te doen. L: Is wel echt een leuke. A: Ik wil nog, maar ik weet pas sinds een paar maanden dat dat bestaat, dat is - ik ben even de naam vergeten - de Nationale Databank Weggegevens. Daarin wordt realtime van alle snelwegen en provinciale wegen en volgens mij ook van de doorgaande stadswegen bijgehouden hoeveel verkeer er rijdt en met welke snelheid het rijdt. Dat is live dus. L: Dat gaat via die lussen in de weg. A: En ook, er worden een paar gegevens gecombineerd. Onder andere die lussen in de weg, ik denk dat dat een van de belangrijkste is, maar ook mobiele telefoongegevens. Hoeveel mobiele telefoons komen er voorbij. Het zijn een paar databestanden die met elkaar gecombineerd worden. Maar daar kun je.. De eerste gedachte die mensen hebben daarbij is: file-informatie. Dat is heel belangrijk. Maar daar gaat het mij denk ik niet om. Ik zou eerder genteresseerd zijn in economische ontwikkelingen. Zijn er nou gebieden die in of uit de gratie raken. We zitten hier in een kantorenpark [vlakbij station Rotterdam Alexander] dat twintig jaar geleden in opkomst kwam. Alle snelweglocaties. Daar ging iedereen werken, dus dat moest je ook zien in het verkeersbeeld. Als er opeens elke ochtend heel veel verkeer hier in de buurt was.. Maar nu zie je op dit soort locaties juist heel veel kantoren leegstaan, omdat het geen swingende locatie is. Dat moet je op de een of andere manier merken. Je moet een maandagochtend van 1985 - bij wijze van spreken, niet dat die data er zijn hoor - kunnen vergelijken met een maandagochtend in 2012. De mensen bewegen zich anders. Als buurten uit de gratie raken, dat zegt ook iets over de economie. Ik rij zelf maar heel weinig

127

NERD MET VIJF POTEN

MASTERSCRIPTIE JAN KRUIDHOF

auto, maar het is mij opgevallen dat in 2009 toen de crisis net bezig was.. Ik moest toen een paar keer door de Beneluxtunnel rijden. Normaal stond het daar altijd was en nu kon ik opeens elke dag doorrijden. Dacht ik van: Hoe komt dat nou? Zou dat nou komen door net die paar vrachtwagens minder? Dat daardoor het verkeer doorstroomt? Of dat je zoiets combineert met benzineprijzen. A: Kun je ook naar kijken. Je kunt die data ook aggregeren, dat je er niet van weg naar weg naar kijkt, maar op een iets hoger niveau. Dat je dingen goed beheert. Maar hier je dus nog niets mee gedaan omdat je de data laat hebt ontdekt? A: Het is er nog niet van gekomen. Maar ik wist pas in mei ofzo dat dit bestond. Dat bestaat ook nog niet zo lang hoor, een jaartje pas. Zijn er ook nog bepaalde manieren waarop je liever aan data komen? Bijvoorbeeld WOBen of opbellen? L: Ja, hoe explosiever hoe beter. Open data is heel leuk en heel goed, maar dat betekent wel dat alle anderen het ook kunnen nadoen of ook kunnen hebben. Ben je heel lang met iets bezig, heeft iemand anders het ook al. Ik vind het het leukste als een dataset hebt waarvan anderen zeggen: Goh, wat leuk dat ze die heeft losgekregen. Waar je gewoon weinig over hoort. Vlak voordat ik wegging bij ANP was ik in gesprek met een zorgverzekeraar die.. Het leek mij heel interessant om te kijken naar welk type contract mensen hebben en hoe vaak ze zich ziek melden. Ik dacht: mensen met een vast contract melden zich veel vaker ziek. Dat is eigenlijk niet iets wat zorgverzekeraars graag vrijgeven, die zitten echt op hun.. Van verzekeringen data los krijgen lukt sowieso bijna nooit. Maar nu had ik iemand die echt wel begreep wat ik wilde. Het ging niet om privacy, het ging ook niet om hun bedrijf in diskrediet te brengen. Het ging om het inzicht in dat type contract. Die had dat helemaal door. Dat vind ik dan zo leuk dat je dan - ik wil er nog steeds wel mee verder hoor - dat je dat dan los kan krijgen, want je weet dat niemand anders dat heeft en het iets nieuws oplevert. Dat vind ik extra leuk. Hebben jullie trouwens een WOBer in dienst? A: Wij hebben Wilmer Heck. Niet dat dat nu de WOBer is, maar die is wel het aanspreekpunt. En cordineert dat niet drie mensen tegelijk ongeveer hetzelfde WOB-verzoek sturen. En Dick van Eijk is ooit min of meer pionier met WOBen geweest. Misschien dat hij een van de eerste twintig WOBers in Nederland was qua het eerste WOB-verzoek of zoiets.

128

NERD MET VIJF POTEN

MASTERSCRIPTIE JAN KRUIDHOF

L: Het is niet dat iemand fulltime zit te WOBen ofzo. Is dat een manier waar jullie graag mee werken? A: Ik moet zeggen: ik heb de WOB nog maar twee keer gebruikt. En een keer daarvan was puur uit ergernis dat Rijkswaterstaat een bestand voor heel veel geld verkoopt terwijl het gewoon overheidsinformatie is. Maar daar ben ik niet mee doorgegaan omdat ik het alleen maar deed omdat ik boos was. Eigenlijk wel jammer dat ik er nooit mee door ben gegaan. Dat was het actueel hoogtebestand. Zie je van elke vierkante meter hoeveel centimeter ten opzichte van N.A.P. het is. Kost toen een miljoen gulden - het is dus lang geleden - terwijl het helemaal door de overheid is verzameld en wordt beheerd. Belastinggeld, ik vind dat moet beschikbaar zijn voor reproductiekosten. Ik dacht dan aan een paar CD-ROMs branden, een paar tientjes hooguit en geen miljoen. Ze hadden toen niet gereageerd op mijn WOB-verzoek en omdat het niet een deel van mijn workflow was om daarmee door te gaan is het mij ontschoten. En een ander ding, en dat sloeg eigenlijk op een van de vragen die jij stelde over dingen die niet gelukt zijn, dat was met de gemeenteraadsverkiezingen van 2010, toen wilde ik van alle kandidaten voor de gemeenteraadsverkiezingen de gegevens opvragen over hun geboortedatum, sekse en woonadres. Dat zijn openbare gegevens, maar bij gemeenteraadsverkiezingen is elke gemeente zelf het hoofdstembureau. De kiesraad heeft daar dan, behalve een paar data, niet echt een functie bij. Er is dus geen centraal aanspreekpunt voor gemeenteraadsverkiezingen. Ik heb toen alle gemeenten ge-e-maild, telefonisch ging dat natuurlijk niet, dat zijn er gewoon te veel, met de vraag: Kunt u mij deze gegevens geven? Sommige gemeenten reageerden direct met de gevraagde gegevens, maar ja, heel veel gaven of geen antwoord of gaven wel de gegevens, maar alleen de namen en niet de leeftijden of de adressen. En toen kwam ik er ook nog eens achter, omdat de adressen altijd wel openbaar waren, dat Binnenlandse Zaken kennelijk vlak voor de verkiezingen aan de gemeenten bericht had gestuurd, dat ze niet meer hoefden in te gaan op de vraag: Mogen wij de adressen hebben? Vanwege de privacybescherming. Dus je moet nu, als je wilt weten wat de adressen zijn, naar het gemeentehuis toe om daar de lijsten in te zien met alle adressen. Dus ze mogen de informatie nog wel laten zien.. A: Ze mten het laten zien, want het is openbaar, maar ze hoeven het niet meer per e-mail ofzo toe te sturen aan mensen. Maar sommige gemeenten hadden dat kennelijk over het hoofd gezien, want die hadden toch gemaild. Maar ik wist dat pas halverwege het proces, dat

129

NERD MET VIJF POTEN

MASTERSCRIPTIE JAN KRUIDHOF

Binnenlandse Zaken dat bericht had gestuurd. [Bij] een aantal gemeenten [heb ik] ook nog, toen ze hadden afgewezen, een beroep op de WOB gedaan. En ik wist wel, de verkiezingen kwam eraan - het was in januari geloof ik dat ik dat deed en de verkiezingen waren in maart - ik wist wel dat ik die procedure nooit zou gaan volgen natuurlijk. En bovendien moet je dat dan vierhonderd keer of een paar honderd keer doen en dat is gewoon te veel. Maar uiteindelijk is dat hele project gewoon niet gelukt om teveel gemeenten moeilijk deden. En de meesten die moeilijk deden die hadden het niet eens over de brief van Binnenlandse Zaken, maar die zeiden gewoon: Daar hebben we geen zin in of ze reageerden niet of ze stuurden de verkeerde gegevens, dus niet alles wat ik vroeg en gingen daarna niet meer op mijn vraag in. Gewoon onwil, eigenlijk. Dat zou je ze nog wel een dwangsom kunnen opleggen, maar dat is gewoon teveel moeite? A: Ehm, ja, het is gewoon teveel. Je kunt niet in je eentje - het waren toen 430 gemeenten, geloof ik - laten we zeggen dat er 250 of misschien wel 300 niet of niet juist op mijn vraag hadden geantwoord. Ik kan niet in mijn eentje 300 procedures volgen. En zelfs de hele krant kan dat niet. Dat moet je iedereen aan het werk stellen. L: Gemeentes hebben heel veel interessante gegevens, maar het is te ingewikkeld.. Alle gemeentes hebben niet eens een eenduidig e-mailadres waarop je ze kunt bereiken. Met politiekorpsen ook, dat is wel een heel stuk minder, maar iedereen houdt het voor zichzelf bij en op een andere manier. Zo kun je dus helemaal nooit iets met politiecijfers doen, want ze zijn niet met elkaar te vergelijken. Dat is echt wel waardoor projecten mislukken. A: Ik wist inmiddels wel van de Kiesraad hoe de uitkomst, de output van de verkiezingssoftware eruit zag. Van sommige [gemeenten, jk] ik kreeg ik precies zon tabel netjes in een computerformaat. Van andere kreeg ik dan een printje wat dan gescand was. L: Ja echt? [Kreunt] A: En die scan was dan weer als een TIFF of een JPEGje naar mij ge-emaild. Dat kan onkunde zijn, omdat ze gewoon niet weten hoe ze iets in een ander formaat moeten doen, maar het kan ook puur.. In Amerika weet ik dat het heel vaak gebeurt dat ze dat doen, zodat ze aan de wettelijke verplichting hebben voldaan: de informatie is er. Maar een gescande PDF, ja, daar kun je bijna niks mee. Dat kun je wel door OCR-software# sturen, maar dat moet je allemaal nog

130

NERD MET VIJF POTEN

MASTERSCRIPTIE JAN KRUIDHOF

controleren. Dus dat is zon enorme hoeveelheid werk. L: Daarom is het wel goed dat dit met de nieuwe WOB gaat verbeteren, als het goed is. Daar staat in dat je het in een digitaal bestandsformaat moet aanleveren? L: Ja, waar je iets mee kan, volgens mij staat dat er in. En heb je ook weleens overwogen om lezers in te zetten of samen te werken met andere organisaties? A: Lezers inzetten nooit overwogen. Jij? L: Ja, bij Sargasso wel, maar daar heb je het denk ik uitgebreid met Dimitri over gehad. Heeft Dimitri verteld over een bouwproject wat we wilden doen? Hij heeft het vooral gehad over de cameras. L: Wat we ook hadden gedaan.. We wilden wel eens weten.. Je hoort altijd alleen maar over bouwprojecten die over hun budget heen gaan en die ver over tijd zijn. We wilden wel eens kijken of dat echt iets is dat altijd gebeurt of zijn er ook heel veel bouwprojecten waar het goed gaat? Gaat het juist bij overheidsprojecten mis of ook bij particulieren? Ik weet wel wat er bij mij om de hoek gebeurt, maar niet wat er in de Kerkstraat in Breda gebeurt, dus toen wilden we er met behulp van lezers proberen erachter te komen. Dat hebben we toen samen met Altijd Wat gedaan, maar dat gaf veel te weinig respons, dus dat was ook een mislukt project. Ik vind het nog steeds superinteressant om erachter te komen, maar er is nog geen databestand van. Sargasso heeft het al een paar keer gedaan. Op de een of andere manier verwacht ik het bij een krant ook niet zo snel. Maar jullie hebben wel een veel grotere achterban. A: Ja, maar je moet denk ik heel goed.. Beroemdste voorbeeld is natuurlijk van de Guardian, met de bonnetjes. Je moet natuurlijk heel erg oppassen hoe je het doet en wat je doet. En mensen die er aan meedoen moeten er ook niet al te veel tijd aan besteden. Wat die lezers toen volgens mij kregen was een willekeurig bonnetje. En dan de keuze: Is dit een interessant bonnetje: ja of nee? Als je dat zo aanbiedt heb je natuurlijk iets waar mensen in hun lunchpauze wel eventjes een paar minuten aan willen besteden en daarna kunnen ze het vergeten, maar dan heb je in ieder geval wel een voorselectie gekregen. Maar de vraag van: Zijn er bouwprojecten bij u in de buurt die ergens aan voldoen?, daarmee zadel je mensen met heel veel werk op.

131

NERD MET VIJF POTEN

MASTERSCRIPTIE JAN KRUIDHOF

L: Ja, dat is ingewikkeld. A: Het zou natuurlijk heel mooi zijn als mensen daaraan mee willen werken, maar ik denk dat niemand daar zin in heeft. Ik heb al niet eens zin als ik op een website kom en er komt zon popupje: Mogen we u twee minuten vragen stellen? L: Ik ook niet. Je moet het altijd toch zelf doen. Want het is vaak ook heel onbetrouwbaar. Je kunt hen niet checken natuurlijk, zelfs als het er geloofwaardig uit ziet. A: Ja en dat was het mooie van The Guardian. Het was alleen maar de vraag: Is dit een interessant bonnetje of niet? En de meesten zullen niet interessant zijn geweest, want die gingen om een puntenslijper van tien cent, dus ja, daar moet je dan maar op vertrouwen, omdat je uit die enorme berg data nooit alles kunt bekijken, omdat het ook alleen maar gescande dingetjes zijn natuurlijk. En als lezers met duizend bonnetjes aankomen, kun je die allemaal bekijken. En dan zie je waarschijnlijk wel duizend keer porno-dvds of weet ik wat voor rare dingen. Hoe ziet jullie workflow er standaard uit? A: Ik denk dat er geen standaard is. Maar gaat het bijvoorbeeld in de volgorde verzamelen, opschonen, verwerken..? L: Die stappen die worden beschreven, die kloppen wel. Alleen niet alles doe je. Soms is data al schoon, wordt het gewoon schoon uit een database gedraaid. Nou, klaar is Kees. En bij het ANP deden we bijvoorbeeld vaak niets aan visualisatie. Dat is wel, ik weet niet.. Je hebt Jelle en Jerry vast ook gesproken, of niet? Jerry ga ik nog spreken. Van Jelle weet ik niet of hij kan en wil praten over RTL. Bijvoorbeeld om Jerry die nu bij Nu werkt als uitgangspunt te nemen. Hij doet volgens mij heel andere vorm van datajournalistiek dan wij doen of ik bij Sargasso of ANP deed. Want hij zoekt heel vaak data bij verhalen, daarom moet het ook zo snel bij hem. Anders verdwijnt het verhaal van de voorpagina en maakt het grafiekje dat hij erbij maakt niet uit. Bij hem is juist de vorm heel erg belangrijk en veel minder dat hij echt zelf trends zoekt in data en daar heel veel verhalen uit haalt. Dat is natuurlijk wel zijn ambitie, maar dat verdwijnt een beetje naar de

132

NERD MET VIJF POTEN

MASTERSCRIPTIE JAN KRUIDHOF

achtergrond omdat hij heel veel met dat visualiseren bezig is. Per medium leg je wel op een hele andere manier de nadruk. Bij het ANP kan je bijvoorbeeld helemaal niets met visualisaties doen. Dat doet Jerry dan weer wel. Maar globaal denk ik dat die stappen, bijvoorbeeld op de site van The Guardian hebben ze een stappenplan gemaakt, dat klopt denk ik wel grotendeels. Dimitri vertelde soms dat hij aardig snel naar de stap van visualisatie gaat, puur omdat hij dan zelf kan zien wat er aan de hand is. En dat hij dan vervolgens weer teruggaat naar het begin. A: Wat ik zelf doe, om aan te geven hoe belangrijk visualisaties zijn.. Als ik een bestand krijg - en als ik dat in Excel kan openen dan doe ik dat - wat ik dan altijd als eerste doe is heel erg uitzoomen in Excel. Dat kan he, dat je het werkblad op tien procent zet. Dan zie je niet meer wat er staat, maar dan zie je wel een tabel. En als dat er visueel raar uitziet, dan zoom ik in op de rare plekken en kijk ik: is daar iets verkeerd gegaan met het importproces? Alsof je de tabel uitprint en vijfentwintig meter verderop gaat staan en dan kijk je: Is dat nu een mooi patroontje, had je dit als behangrol kunnen gebruiken? L: Wat grappig! A: En soms zie je dat het rechterrandje opeens een bulpje heeft. Was het een CSV-bestand bestand, wat met kommas gesepareerd wordt? Dan kan het zijn dat er ineens kommas die eigenlijk tekstkommas zijn, dat die als separeerkommas zijn gezien. Dat heb je heel snel door met puur visualisatie. Dat is een hele goede tip denk ik. Maar het laat ook zien dat visualisatie heel belangrijk is. Je kunt ook puntenwolken maken bijvoorbeeld. Stel: je vraagt je af of er een verband is tussen de lengte van een hardloper en hoe snel hij aan de finish is. Als je daar de gegevens van hebt, dan maak je daar eerst een puntenwolkje van. Als dat een mooi wolkje is, wat een beetje bij elkaar zit, dan heb je een verhaal. Als het allemaal in een cirkel staat: laat maar gaan, daar hoef je niet eens verder naar te kijken. L: Dat vind ik ook. Heel veel dingen, zeker die demografische dingen, die gaan op gemeente-, wijk- of postcodeniveau. Daar zie je niets in als het in een tabel staat. Dan gooi ik het ook altijd even in een kaart. Zelfs al gebruik je die kaart uiteindelijk niet voor je verhaal? L: Misschien wel juist. Uiteindelijk gebruik ik misschien wel een kaart voor het verhaal, maar

133

NERD MET VIJF POTEN

MASTERSCRIPTIE JAN KRUIDHOF

dat is dan een kaart vijf versies verder. Maar het verhaal zie je pas als je het op een kaart neerzet. Of bijvoorbeeld een lijndiagram. Bij de analyse gebruik ik ook zeker visualisatietools. Gaan jullie voor de uiteindelijke vormgeving ook naar een afdeling vormgeving en vertel je dan precies hoe je het wil hebben? A: Wel voor de papieren krant. We hebben een studio waar mensen heel mooi dingen in Illustrator en Photoshop kunnen maken. Ik geef wel altijd gegevens aan ze die, zoals ik ook bijna al wil dat het eruit komt te zien. Alleen zij kunnen het mooier maken en ik ben geen kunstenaar. Ik ben ook al lang blij dat zij daar zitten. Maar op het web: eigenlijk is er gewoon helemaal geen geld voor dingen op het web maken. Ik blijf het doen. De krant had een strategie tot twee jaar geleden: We gaan alles op het web doen en het web wordt een betaalmuur en alles wat we doen moet eigenlijk op de site komen. Zo ben ik ook mijzelf visualisaties op het web aan gaan leren. Ik dacht van: Dat wordt mijn toekomst [lacht]. Die strategie is helemaal veranderd. Die website heeft een eigen redactie van een paar man, eigenlijk. En dat moet snel nieuws zijn. Wat op zich goed is hoor, dat is geen kritiek op die strategie. Alleen, zoals stembureau-uitslagen enzo, dat mag die redactie eigenlijk niet meer doen. Maar ja, ik had mij net aangeleerd in de jaren daarvoor hoe ik die geografische visualisaties moet doen, tja, dan ga ik het ook gewoon doen. Dus eigenlijk mag een krantenredacteur niet aan de website.. A: Nee, eigenlijk mag dat niet. Kijk, er is niemand die met een scheidsrechtersfluit achter je gaat staan als je het doet. Maar dat is om dubbelwerk te voorkomen? A: Het komt er eigenlijk op neer dat.. Het heeft voor een groot deel.. Grofweg heb je nrc.next, NRC Handelsblad en NRC.nl. De eigenaren van ons willen - en dat geldt voor alle bedrijven kijken: Zijn al die afdelingen rendabel? Dan moet je weten hoeveel mensen hebben zijn in dienst, wat kosten die mensen en wat zijn de opbrengsten uit de verkoop van dat medium. Dat kan je alleen maar doen als mensen niet voor iedereen werken, want dan weet je niet hoeveel mensen er eigenlijk bij next werken. Dat is nu veel helderder omdat er nauwelijks meer wisseldiensten zijn, die je een paar jaar geleden wel had. L: Nu worden er alleen maar artikelen doorgeschoven, haha. A: Waarschijnlijk wordt er een soort bedrag gehangen aan een artikel dat in NRC Handelsblad

134

NERD MET VIJF POTEN

MASTERSCRIPTIE JAN KRUIDHOF

wordt geschreven. Dat wordt in nrc.next doorgeplaatst en ik neem aan dat next dan virtueel geld moet betalen aan NRC Handelsblad. Zo werkt dat bij alle bedrijven hoor, daar is niets raars aan. Vind ik ook alleen maar goed. Je moet weten of dat wat je doet geld oplevert. Maar het nadeel is dus dat je niet meer van elkaars expertise kunt profiteren. Veel minder makkelijk. Maar als ik een mooi project heb en ik kan er een interactieve kaart bij maken, dan doe ik dat gewoon. Zijn jullie er wel eens tegenaan gelopen dat iets heel mooi online zou kunnen, maar.. A: Nee. L: Ik denk wel dat het hier zo is dat.. De krant is gewoon het grootste verdienmodel. Als er een heel gaaf verhaal in de krant staat, dan zet je misschien een teaser op de site. Maar uiteindelijk wil je dat mensen die krant kopen. Terwijl de aandacht genereren met zon gaaf data-artikel doe je met de krant en niet met online. En dan is het wel zo met zon CBS-kaart bijvoorbeeld, daar heb je niets aan in de krant. Want dat past niet op papier. A: Er was wel een spreadsheet, maar daar laat je een paar voorbeelden zien. L: Maar dat interactieve dat is echt iets wat alleen maar op het web kan. Daar verwijs je dan ook naar, maar dat is meer service. Dat moet je heel leuk vinden. Ik snap wel dat de krant daar niet vijf redacteuren op gaat zetten. Dat kan gewoon niet uit. A: Dat ik dat toen gedaan heb.. Het leuke wat ik zelf vond.. Mensen bleven daar maar naar kijken. De totale hoeveelheid mensen die het hebben gezien was misschien niet eens zo groot, maar mensen bleven er heel lang, er werd heel veel over getwitterd. Dat geeft natuurlijk ook wel een goede naam aan NRC Handelsblad als krant. In die zin is het wel geld waard. Dus het is niet zo dat het voor mij hobbyisme is en dat de hoofdredacteur daar boos over is. Die zit natuurlijk ook wel dat dit iets innovatiefs geeft aan NRC Handelsblad. Van: Hier werken mensen die wat kunnen of zoiets. Maar zoiets als een datablog van The Guardian is dus niet wat jullie graag zouden willen? A: Ik weet het niet. Waar ik zelf, maar dat is puur mijn persoonlijke mening, maar ik vind: je moet je energie vooral steken in je werk, in plaats van altijd maar over je werk te praten. Ik vind datajournalistiek heel belangrijk, ik vind het leuk dat jij hier bent, maar als ik op alle uitnodigingen enzo was ingegaan.. Dan ben je alleen nog maar meta aan het praten: Dit zou

135

NERD MET VIJF POTEN

MASTERSCRIPTIE JAN KRUIDHOF

mooi zijn, Dat zou mooi zijn, Heb je gezien wat die mensen gedaan hebben?. Dan dat je nu echt wat doet. Zon datablog ja. L: The Guardian zet daar ook wel datastukken op. Ze doen nu af en toe iets metas, maar niet heel vaak. Dat bedoelde ik inderdaad. Dat je die stukken online ziet staan. A: Maar er zijn niet zoveel stukken. Dan zou het eens in de maand ofzo geupdate worden. L: Dat is denk ik wel het grote verschil: The Guardian heeft ook wel vaak - ik wilde dat dat bij het ANP ook wel eens kon, in plaats van dat er altijd een newsangle in moest zitten - iets als: Hoe zit het met de tienermoeders in Engeland? Dan zetten ze daar een kaart en een dataset bij en dat is het voor hun dan. Maar dat zou voor NRC nooit voldoende zijn. Daar moet altijd een verhaal achter. Is er iets gebeurd met de tienermoeders? Laat een tienermoeder aan het woord. A: Je kunt heel makkelijk zeggen: Ineens veel minder tienermoeders. L: Maar dan moet dat er wel in zitten. A: Of de kop mag ook zijn: Tienermoeders een voortdurend probleem, als ze niet af- of toenemen. L: Dat zou inderdaad kunnen. Dat was ik bedoelde met die doelstelling. Dat je werkt vanuit het idee dat er een verhaal in moet zitten. A: Niet zozeer een verhaal, maar ook gewoon nieuws. Maar nieuws is een heel ruim begrip. Wat ik net zei van tienermoeders - als het constant blijft kan het ook nieuws zijn dat het gelijk blijft. L: Maar dan is het nieuws: Beleid heeft geen invloed. Als er beleid op wordt gemaakt. Ik zou het als lezer alleen al interessant vinden, ook al is het ontzettend vanzelfsprekend, dat je bijvoorbeeld in bepaalde steden ontzettend veel tienermoeders hebt en in andere gebieden niet. A: Maar dan nog.. Ik ben ooit bij de krant gekomen in 1996 om alleen maar graphics te maken in

136

NERD MET VIJF POTEN

MASTERSCRIPTIE JAN KRUIDHOF

een papieren bijlage. Was dat Profiel? A: Ja, precies. Toen ik hier na een tijdje ervaring in kreeg heb ik voor de krant de regel opgesteld - en die regel geldt nog steeds, de Arlen Poort-regel boven graphics: er moet altijd een nieuwskop boven staan. Er moet een kop staan die laat zien wat je kunt zien in die graphic. Bijvoorbeeld: Meeste moorden in Amsterdam en dan zie je een kaartje waar Amsterdam uit sprint. Of: Dip in inflatie en dan zie je de inflatie dalen. Volgens mij is dat gewoon wat je als krant moet doen. Het gaat over nieuws. Dit zijn dingen die nieuws zijn, maar we laten ook zien aan een lezer: waarom moet ik dit lezen en wat kan ik hieruit concluderen. Je moete mensen een beetje bij de hand nemen. Dat moet je niet paternalistisch zien, maar.. Je moet niet zomaar iets over de schutting flikkeren bij een lezer of een bezoeker van je website en zeggen: Zoek het maar uit. Je moet laten zien: Dit is interessant, want.. L: Daar ben ik het zeker mee eens. The Guardian doet dat vaak niet en als je het bekijkt vanuit het idee van NRC, dan zouden wij het moeten doen voor in de krant. En dat kleine hapsnap nieuws, dat kost ons meer tijd dan wanneer het CBS met iets komt, dus dat is niet echt de moeite. Dan kun je beter je energie steken in wat grotere projecten. En daar past zon Guardianblog weer niet bij. Dat is wel echt een verschil in visie, ik weet zeker dat Jerry hier anders over denkt bijvoorbeeld. Of ik weet van RTL - niet van Jelle, maar van die mensen zelf dat ze zeggen: Of de opening van het half acht Nieuws of laat maar zitten. Dat is een beetje gechargeerd gezegd. Beetje alles op niets. L: Precies. A: Wij hadden een spread over het slechte weer, gecombineerd met de Vierdaagse. En ik had daar drie graphicjes bij gemaakt, over alle zomers van 1970 tot nu toe. Dus van 1 juni tot 16 juli, gewoon: hoeveel uren zon, hoeveel uren regen. Dat zijn gegevens die op de website van het KNMI staan. Alle daggegevens kun je downloaden, gooi je in Excel, maak je kleine selectie van, draai je een beetje om, je kneed het een beetje, hoppakee: leuk grafiekje, uurtje werk. Dat is ook een vorm van datajournalistiek die er niet zo uit ziet. Dat is alleen maar een illustrerende graphic die wel meteen de vraag beantwoordt: Is dit nou de slechtste zomer zolang ik mij kan herinneren of niet? Was niet zo. Dat is ook een vorm van datajournalistiek die puur service is en

137

NERD MET VIJF POTEN

MASTERSCRIPTIE JAN KRUIDHOF

gewoon het geven van de feiten. Dat was geen groot nieuws, maar wel illustrerend. Het geeft wel informatie. Maar dat zijn geen grote projecten, dat kost een uurtje. L: Dat zou wel een los artikel op zon datablog worden, om de vergelijking te trekken. A: Daar zou ik dan geen zin in hebben, om dat op een datablog te zetten. L: Precies, dat is niet.. Nee, je moet het bij de krant houden. A: Tenzij zon datablog nu een miljoen bezoekers per dag trekt en ook geld genereert. Dan is het wat anders. Maar anders is het echt parels voor de zwijnen gooien. Denken jullie wel eens vooruit: stel, we zijn een paar jaar verder, de krant wordt vooral op iPads gelezen? Zou je dan bijvoorbeeld meer met infographics gaan werken dan met vaste plaatje? A: Dat ik die interactieve kaarten publiceer.. Ik probeer mijn eigen kennis op peil te houden om interactieve dingen te maken. L: Dat is wel waar het uiteindelijk meer naartoe zal gaan. Als je kijkt naar de oplage van de iPadabonnementen: dat gaat wel omhoog. Tuurlijk, daar zit wel toekomst in. A: Ik hoop het zelfs. Maken jullie ook wel eens iets speciaal voor de iPad? A: Nee. We proberen wel dingen.. De kaarten die ik maakte werkten voorheen niet op de iPad, maar dankzij de nieuwe versie van het open sourceprogramma Open Layers, niet genoeg te prijzen, werkt het nu wel op de iPad. En ik heb wel alle kaarten op de service gezet. maar ik moest een aantal dingen op de kaart aanpassen. En dat heb ik gedaan. Gewoon omdat ik het heel belangrijk vindt dat mensen dat op hun iPad kunnen zien. L: Maar die is niet apart in de app toch? A: Nee, gewoon op de website. De app is eigenlijk gewoon de papieren krant waar je door je beeldscherm naar kan kijken.

138

NERD MET VIJF POTEN

MASTERSCRIPTIE JAN KRUIDHOF

L: Ik denk, over twintig jaar wordt het een beetje Harry Potter-achtig.# Maar nu.. Nu is het gewoon een soort PDF? L: Ja, maar dat is voor alle kranten zo. Ik lees ook de Volkskrant-app, die gebruikt hetzelfde techniekje als wat andere kranten gebruiken. Bijvoorbeeld Wired maakt echt een aparte editie voor de iPad, maar zo ver zijn kranten in Nederland nog lang niet. A: Dat heeft er ook weer mee te maken.. Je ziet de iPad-abonnees toenemen, maar in zijn totaal is misschien vijf procent of minder dan je totale aantal abonnees. Ja, hoeveel geld ga je investeren in zon kleine groep? Maar je kunt tegelijk denken: als je er meer investeert, wordt die groep groter. Maar dat is de vraag: hoe ga je investeren? Uiteindelijk zal het wel gebeuren, maar of dat over drie jaar of over tien of twintig jaar is.. L: Maar het is wel mooi om de kennis die we nu opbouwen, die kun je uiteindelijk daarin toepassen. Dat is wel mooi eraan. Doen jullie na publicatie nog iets met updates? A: Eh, ligt eraan wat je update noemt. Het nieuws is elke dag anders. Maar als je een artikel hebt gepubliceerd: bijvoorbeeld het CBS-artikel. A: Stel dat ze over twee jaar nieuwe postcodegegevens hebben, dan kan ik ook vergelijkingen maken tussen toen en nu. L: Maar dat is dan weer een nieuw artikel. A: Je moet volgens mij niet.. Dat is het lastige denk ik op het web. Als je dingen gaat updaten, moet je heel goed nadenken over wat echt nieuw is en wat een beetje nieuw is. Volgens mij kun je dan beter voor het echt nieuwe gaan en een nieuw artikel publiceren met nieuwe.. L: En daar kun je dan wel weer de niet heel erg newsy informatie onder hangen, dat je daarna weer een zo volledig mogelijke set gebruikt. Maar mensen vinden dat ook niet meer. Het is nooit zo dat er nog 100.000 hits komen op iets dat al drie weken geleden is gemaakt. Dus het is de moeite gewoon niet.

139

NERD MET VIJF POTEN

MASTERSCRIPTIE JAN KRUIDHOF

Wat zouden jullie graag toevoegen aan de werkwijze wat nu nog niet kan? Bij de BBC hebben ze bijvoorbeeld een team waar de vormgever ook een beetje data aankan en een beetje kan schrijven. A: Ik zou wel willen dat er meer mensen zijn die dit werk ook kunnen doen. Omdat je dan meer interactie en ideen van mekaar hebt. De beste ideen krijg ik in ieder geval als ik met anderen praat. En als er helemaal niemand is die op de manier kan denken zoals jij denkt, dan voel je je een beetje eenzaam. Daarom ben ik blij dat ik voor een groot deel gewoon eindredacteur ben, anders is het helemaal zon eiland. L: Ja, alleen datajournalistiek doen is wel een beetje veel. Je bedoelt: in je eentje of puur en alleen met datajournalistiek bezig zijn? L: Allebei. Dataprojecten duren vaak lang. Ik ben zelf redelijk goed met computers, maar ik zou graag beter willen kunnen programmeren, omdat dat de hele tijd de dingen zijn waar ik tegenaan loop. Ga ik toch weer een hele middag zitten proberen en lukt het uiteindelijk niet. Gaat er weer een dag overheen als ik iemand anders moet vragen die me wil helpen. Als je daar een programmeur bij hebt zitten - voor mij zou dat twee keer zo snel gaan. Dat versterkt elkaar een beetje. Of als een vormgever er naar kijkt en zegt: Wow, dat is gaaf! Ik ben van huis uit geen vormgever, ik denk meer in vragen. Dus ja, dat geeft natuurlijk een beter beeld. Wat zie jij als grootste verschillen tussen NRC en Sargasso qua datajournalistiek? L: Zover ben ik nog niet, ik werk hier nog maar twee-en-een-halve week. Waarom ik het wel heel leuk vind om hier te gaan werken is dat het niet alleen datajournalistiek is. Ik ben voor een heel groot deel factchecker - die rubriek aan het begin van next - en dat vind ik heel leuk: dat je dagelijks met iets bezig bent wat morgen in de krant kan staan. Terwijl je op dataprojecten soms wel drie weken je tanden kan stuk bijten. En uiteindelijk blijkt het misschien wel niets te zijn, bij wijze van spreken. Dan kabbelt het een beetje voort. Ik vind die urgentie en afwisselijk nu heel leuk. Maar goed, dat factchecken heeft niet zoveel met datajournalistiek te maken. Maar het grootste verschil met ANP en hier is wel de manier van presenteren. Laatst had ik hier met Oscar, van de Haagse redactie, een verhaal over hoe de toekomst van de Tweede Kamer eruit gaat zien. De peilingen plus tien procent van het aantal zetels is ongeveer de demografie van de Tweede Kamer die er na 12 september zal gaan zitten. Daar hadden we een verhaal over gemaakt. Dat kan dan in next op de voorpagina en op pagina vier en vijf en in Handelsblad ook

140

NERD MET VIJF POTEN

MASTERSCRIPTIE JAN KRUIDHOF

nog op twee paginas. Met graphics erbij. Dat kan nooit bij het ANP. Dan klinkt het heel erg eigengeilerij als ik denk: Mijn ding moet er groot in, maar het is meer dat je er veel aandacht aan besteed. Het is niet: je belt iemand en klaar is Kees, wat veel stukken natuurlijk ook wel zijn. Handmatig waren al die dingen bij elkaar gezocht. Bij het ANP zou het verdwijnen in een berichtenstroom met 2000 tekens en dat is het. Dat is wel een van de redenen voor mij om ook hiervoor te kiezen, omdat er veel meer presentatiemogelijkheden zijn. Wanneer kwam jij in aanraking met datajournalistiek? L: Ik vond statistiek al heel interessant tijdens mijn bachelor [Communicatie- en Informatiewetenschappen, jk], maar de reden dat ik dit uiteindelijk daadwerkelijk ben gaan doen is dat ze bij mijn opleiding voortdurend zeiden: Kies een niche, kies een niche, anders kom je er niet. Dat blijkt ook wel zo te zijn, want ik koos dit en direct sprak ik met Dimitri en een maand later had ik een baan. En nu heeft Rob me bij Dimitri weggeplukt omdat er zo weinig mensen zijn die het doen. Want degene die dat hier deed gaat naar Moskou. Dat werkte dus en dat was voor mij een van de belangrijkste redenen om me hierin te verdiepen. Buiten dat ik het interessant vond. Maar zo ben ik er wel heel snel ingerold. Het was nog zo klein dat als je je een beetje mengt en je kop boven het maaiveld uitsteekt dat iedereen je ook ziet. En wat was het eerste van datajournalistiek dat je zag? Waardoor je berhaupt op het idee kwam dat het een niche voor jou zou kunnen zijn? L: Dat weet ik niet. We hadden vijf of zes richtingen waarin je je scriptie kon schrijven. En dat waren een beetje de begeleiders die daarbij hoorden. Toen heb ik daar voor gekozen. Mijn vorige scriptie ging over digitaal lesmateriaal, dus dat past er goed bij. Namelijk op een digitale manier ingewikkelde informatie ontsluiten en lieftst ook nog met infographics. [Laura verlaat gesprek, moet weer aan de slag.] Zijn er bepaalde websites die je in de gaten houdt? Bepaalde beats? Wat ik altijd leuk vind is Flowing Data, daar kijken volgens mij heel veel mensen naar. Van Nathan Yau - ik denk dat hij een Chinees is. Eigenlijk verzamelt hij vooral interessante of juist slechte - maar dat zijn daarom ook interessante - voorbeelden van visualisaties. Dat zijn twee of drie postings per dag. En dat kan echt van alles zijn. Grappige cartoons, die toch iets over datavisualisatie zeggen of echt interessante nieuwe onderwerpen die bij een of andere krant online zijn gezet. Maar dat is meer gewoon leuk om te zien. Kan soms inspiratie zijn, soms alleen

141

NERD MET VIJF POTEN

MASTERSCRIPTIE JAN KRUIDHOF

maar leuk. Maar ook sites voor bronnen? Rijksoverheid, CBS? Ja, ik ben geabonneerd op alle RSS-feeds van het CBS. Dat zijn denk ik vijftien berichten per dag. Maar het meeste gaat over economische onderwerpen die heel erg gaan over een bepaalde sector. Dan denk je: Zal wel. Maar zo zie je wel alles wat het CBS elke dag publiceert. En dat is toch wel een van de belangrijkste bronnen. Voor de rest probeer ik wel eens in de zoveel tijd dingen in de gaten te houden, maar dat gaat niet altijd even gestructureerd, over de open data website van de rijksoverheid. Nationaal Geo Register, dat is een beetje een vreemd website waarin alle open geografische bestanden van de overheid zitten. Ook lang niet alles trouwens hoor. En ook heel veel dingen van gemeenten, dus alleen de gemeente Eindhoven. Dat kan op zich interessant zijn als je voor het Eindhovens Dagblad werkt, maar voor ons natuurlijk helemaal niet. Dat soort dingen hou ik wel in de gaten. Maar het belangrijkste is misschien wel de RSS-feeds van het CBS, denk ik. Zijn er ook nog onderwerpen die jouw persoonlijk aanspreken? Eh, verkiezingen is eigenlijk van oudsher.. Mijn allereerste verkiezingen waren in 1998, gewoon omdat in de bijlage Profiel zouden de verkiezingsuitslagen komen. En Dick van Eijk had toen toen werkte ik hier nog niet - voor het eerst van die kaarten gemaakt. Dat was de allereerste keer dat de uitslag op kaarten stond. Dat heb ik gelezen inderdaad. Op die oude computers. Toen gloednieuwe computers, in 1994 had hij het gedaan. Maar nu werkt dat in een paar seconden, of minder, maar toen was je echt een paar uur aan het rekenen op een oude MS-DOS computer, als je iets wilde laten zien. Maar goed, ik werkte hier toen nog niet, maar toen ik die kaarten zag als abonnee dacht ik: Wow, dat is interessant, dit wil ik ook kunnen. Maar goed, sinds 1998 heb ik altijd de verkiezingsuitslagen gedaan. Later ook op het web. Als ik ziek ben, dan zijn ze er niet, bij wijze van spreken. Het is een beetje van mij geworden. Niet dat is de baas ben geworden. Verandert de aanpak ook nog? We hebben sinds 2010 interactieve kaarten op web, wat we daarvoor niet hadden. We hadden wel.. Dick van Eijk heeft toen zelf wel eens HTML image maps# gemaakt. Maar daar kun je niet op inzoomen, dat is veel rudimentairder. Dat is eigenlijk gewoon een GIFje# waar je op kunt

142

NERD MET VIJF POTEN

MASTERSCRIPTIE JAN KRUIDHOF

klikken en dan komt er iets tevoorschijn, maar dan veel rudimentairder. Maar eigenlijk verschilt de aanpak ervan niet. Want op de verkiezingsavond wil je gewoon weten: wat is de totale uitslag en wat is er gestemd in de gemeente waar ik woon. Maar de kaarten van nu zijn weliswaar live, maar bieden niet meer informatie dan die kaarten uit 1994. Want er is ook niet meer informatie beschikbaar. Het zijn verkiezingen, dat is het nu eenmaal. En je bent begonnen in.. Ik ben stage gaan lopen in 1995 en in 1996 in dienst gekomen voor de Profiel-bijlage. Ik was als kind altijd gek op landkaarten en op de Bosatlas. Maar ik kwam hier toen om infographics te maken. Er was n PC op de krant, een Windows 95-PC, toen net nieuw. Ik had al heel snel Excel ontdekt. Voor infographics moet je vaak getallen hebben en die moeten gestructureerd zijn, dus heel vaak was ik dingen van papier aan het overtikken. Internet ging gewoon met een geluidsmodem, heel langzaam dus. Het CBS kwam net met Statline, maar dat was nog niet op de website. Dan kreeg je elke maand een CD-ROM. Maar goed, ik heb toen wel heel snel ontdekt dat - alleen al door Excel veel te gebruiken - dat je daar interessante dingen mee kan doen. Aanvankelijk, als ik dan een graphic moest maken.. Dat kon elke week een ander onderwerp zijn. Stel dat ik wilde weten hoeveel, verzin maar wat.. Van 1980 tot 1995 hoeveel mensen er in Nederland woonden. Dat zocht je aanvankelijk naar 1980: zoveel miljoen. 1981: zoveel miljoen. Maar op een gegeven moment zag je: er zijn ook bestanden waar het per gemeente staat. En dat kun je dan wel groeperen, zodat je hetzelfde grafiekje kunt maken, maar je kunt ook kijken: is er een regionale verandering. Zo ga je langzaam dingen ontdekken van bestanden die niet hetzelfde zijn als wat je publiceert in de krant. En als spelenderwijs eigenlijk ben ik er ingerold. En die cursussen bij IRE, wanneer waren die dan ongeveer? Ja, ik ben een keer bij NICAR geweest. Daar heb ik heel veel aan gehad. Vooral omdat ik daar een beetje heb leren programmeren. Dat was zoiets als een VVOJ-conferentie, maar daar heb je dus tientallen onderwerpen waar mensen over praten. Maar ik heb toen drie verschillende tracks gevolgd om met PERL te programmeren. Eigenlijk een beetje een ouderwetse programmeertaal, maar die doet wat je wil. En het voordeel was dat het werd gegeven door medejournalisten, die wisten dus precies waarvoor je het nodig zou kunnen hebben. Dat is een erg groot voordeel. Maar als je dat dan drie keer een uurtje hebt gedaan, dan ben je over de drempel van de angst om te programmeren heen gezet. Maar je hebt verder geen scholing gehad in programmeren?

143

NERD MET VIJF POTEN

MASTERSCRIPTIE JAN KRUIDHOF

Nee, maar ik heb wel vroeger, toen ik een jaar of vijftien was, toen had ik een huiscomputer.. Toen heb ik in Basic wel geprogrammeerd, maar niet heel erg uitgebreid. Het lastige bij programmeren is dat je moet weten wat je wilt. Je kunt wel achter een computer gaan zitten en zeggen: nu ga ik iets programeren. Maar je moet wel een doel hebben. En wat ik eigenlijk wilde: dat webscrapen, dat heb ik toen geleerd. Dat je een programmaatje schrijft, dat programmaatje gaat voor jou naar een website toe en haalt de informatie eraf waarvan jij tegen het programma hebt gezegd: Dat wil ik eraf hebben. En dan kun je dan bijvoorbeeld elk jaar doen. En daar herkende ik de kracht van. Dat kan heel belangrijk zijn, als er op een website informatie staat die je niet kunt krijgen. Niet op een andere manier dan op die manier. En zo heb ik langzamerhand ook wel wat meer programmeertalen.. Die webapplicaties met interactieve kaarten is bijna helemaal JavaScript, maar goed, als je hebt geleerd om niet bang te zijn om iets in PERL te doen, dan kun je ook wel JavaScript aanpassen. Niet dat ik nou een grote programmeur ben, helemaal niet. Maar als je dit op papier zet, zullen veel journalisten toch wel denken: Wow, wat is die al ver. Ja, dat is waar. Maar je moet zorgen dat je.. Volgens mij is het het makkelijkst als je ook toegang hebt tot het maken van een website. Dus dingen op een server kan zetten bijvoorbeeld. Volgens mij is het heel erg nuttig om met JavaScript een beetje aan de gang te gang. Er zijn genoeg websites met heel veel voorbeeldjes, bijvoorbeeld http://www.w3schools.com. En zo leer je denk ik heel snel zien wat je kunt doen met JavaScript. Daar kun je niet echt mee webscrapen, maar.. Het is denk ik vooral een drempel die je over moet. Angst en ingewikkeld en computercode. Als je dat voor het eerst ziet dan denk je: Wat staat hier? Scrapen jullie nog vaak? Funda doe ik nog steeds elke week. En andere onderwerpen? Ik heb diverse keren de Overheidsalmanak gescraped, gewoon om te weten welke burgemeester bij welke gemeente zat. En dat ging dan om zijn partij. Die gegevens waren wel ook op een andere manier beschikbaar, maar het was uiteindelijk makkelijker als ik heel snel een scriptje schreef waarmee ik dat van die website haalde. Dus het was niet dat ze het niet wilden geven? Nee, maar dan kreeg je weer XML en dat was gewoon teveel gedoe dus ik dacht: Ik doe dat wel

144

NERD MET VIJF POTEN

MASTERSCRIPTIE JAN KRUIDHOF

eventjes, dat gaat sneller. En bijvoorbeeld ook de Gouden Gids voor dingen gescraped. Onder andere over horeca, maar volgens mij is daar uiteindelijk niets mee gedaan. Want Jan Meeus die wilde weten waar alle cafs in Nederland zaten. Op de Gouden Gids-website kon je dat natuurlijk makkelijk zien. Dat is wel legaal? Het enige wat niet legaal zou zijn, is dat je daarna weer die lijst met al die cafs zou publiceren. De Gouden Gids heeft het copyright natuurlijk op de manier waarop ze de informatie tonen. Maar als ik via de Gouden Gids-website met de hand zou schrijven waar alle cafs zitten en ik zou daarna gaan turven dat er duizend in Amsterdam zijn en zevenhonderd in Rotterdam, dat staat je vrij. Zou je die cafs dan wel in Google Maps mogen zetten? Nee, want dan zou je de individuele gegevens gebruiken. Maar dat was ook helemaal niet het plan hoor. Kijk, zoals met het scrapen van die Albert-website: in principe is die informatie voor iedereen die naar die website gaat of de winkel van Albert Heijn binnenloopt beschikbaar om op te schrijven. Je doet het alleen wat sneller? Ja. En ik doe er ook niets mee om hem als supermarkt te gaan beconcurreren. Over de medewerkers: Laura zei dat ze nog wel een programmeur wilde hebben. Heb jij dat ook? Laura werkt hier natuurlijk pas twee weken, maar de webmasters hier kunnen ook heel goed PHP, JavaScript, SQL. De technische jongens van de website kunnen heel veel. Ik vind het leuk om in mijn vrije tijd uren te pielen om een JavaScript werkende te krijgen, maar Appie [Verschoor, de webmaster] heeft dat waarschijnlijk in vijf minuten voor elkaar. Maar ik vind het leuk om zelf te leren en dat doe je alleen met vallen en opstaan. En stappen jullie vaak naar hem toe? Jajaja, heel vaak. Het vaakste voor de interactieve kaarten. Hij is sowieso de webmaster, dus sommige dingen moet ik gewoon met hem overleggen. Maar ook technische kwesties. En binnenkort, als de verkiezingsuitslagen de avond van 12 september.. Novum, ons ANP zal ik maar zeggen, die hebben telefonisch contact vanuit hun callcenter met alle gemeenten. Zodra er

145

NERD MET VIJF POTEN

MASTERSCRIPTIE JAN KRUIDHOF

een uitslag binnen is tikken zij dat over. Novum moet ons die gegevens weer aanleveren. En Appie zorgt dat die gegevens binnenlopen en ik zorg ervoor dat die gegevens dan weer in de interactieve kaart komen. Dus we moeten in die zin samenwerken. Maar hij helpt mij ook als ik er in JavaScript niet uitkom. En zijn ervaring is tien keer zo groot als die van mij. Zonder hem zou het allemaal nooit gelukt zijn, denk ik. Wat betreft de organisatie: hebben jullie een eigen plek op de redactie? Nee en ik vraag mij ook af of dat een goed idee is. Daar kun je op heel veel verschillende manier over denken. Maar wat je doet is gewoon journalistiek. Je hebt ook geen groepje mensen die heel goed kunnen interviewen. Of mensen die alleen maar reportages kunnen schrijven. In principe is iedereen journalist. Kijk, er zijn natuurlijk wel mensen die veel beter in een persoonlijk interview zijn dan anderen. En er zijn mensen die veel beter zijn in de Haagse kaasstolp. En mensen die beter zijn in het schrijven van reportages over de onderkant van samenleving. Iedereen heeft zijn liefhebberij of zijn specialisme. En dat moet je vooral gebruiken. Maar het blijft gewoon journalistiek. Alleen je past technieken toe die nog weinig anderen gebruiken. Maar stel.. Eerder dit jaar ben ik bij die nieuwe datajournalistiek opleiding in Tilburg geweest. Ik heb toen met Thalia een soort gastcollege gegeven. En daar zaten volgens mij zeker een stuk of zestig studenten. Als die allemaal in de journalistiek terecht komen en elk jaar zijn het er weer zestig. Dan krijg je natuurlijk veel meer mensen die op deze manier journalistiek bedrijven. Dan is het binnen de kortste keren normaal. Daar hoef je geen apart groepje van te maken. Het is al lang journalistiek, dat was het tien jaar geleden ook al. Het enige is: je loopt tegen technische vragen aan. Technische vragen die je als opschrijfboekjejournalist niet hebt. Hoe werkt dit op mijn computer? Welke functie kan ik hiervoor in Excel gebruiken? Wat is de SQLcode ergens voor? Dat zijn technische vragen die je voor een groot deel ook op internet beantwoord kan vinden. Maar het is prettig als er mensen in je omgeving zitten die het antwoord waarschijnlijk hebben en dat je elkaar daarmee kan helpen. Dat is de enige reden waarom je ze bij elkaar zou willen zetten. Maar ja, dan hoef je ze niet eens aan n bureaublok te zetten, maar gewoon binnen n organisatie.

146

NERD MET VIJF POTEN

MASTERSCRIPTIE JAN KRUIDHOF

Jerry Vermanen (Nu) Wat is hier jouw doelstelling? Mijn doel is om hier bij Nu met data om te gaan. Aan de ene kant visualiseren. Er komt veel nieuws binnen waar getallen in zitten. Voor lezers is het soms heel lastig om bepaalde getallen in een context te plaatsen, om te begrijpen: wat betekent dit nou? En we hebben heel veel economische berichten. Dat is vaak heel lastig, hele lastige onderwerpen. Het gaat over rente en over inflatie en dat soort zaken en dat helpt heel veel om dat in een tekst uit te leggen en soms is het ook heel goed om naast die tekst een afbeelding te hebben van: Dit betekent het en dit daalt en daarmee maak je lezers op een bepaalde manier, geef je ze cijferwijsheid mee. Je leert ze wat makkelijker met die cijfers om te gaan. Je geeft ze wat inzicht, van: Kijk, hier gebeurt het, hier is een omslag en Kijk, omdat dit negatief is krijg je geld in plaats van dat je geld toelegt. Het is gewoon: hele ingewikkelde materie visualiseren en uitleggen. Aan de andere kant willen we bij Nu ook zelf data verzamelen en daar ook zelf nieuws uithalen. Dat eerste, data visualiseren, is op zich vrij makkelijk. Ligt eraan hoe moeilijk je het maakt, maar soms heb je gewoon een pak data waar je een hele ingewikkelde visualisatie bij maken, maar soms werkt een lijngrafiek of een staafdiagram net zo makkelijk. Maar dat data verzamelen en daar zelf nieuws uithalen dat is nu nog wel een echte uitdaging. Zelf bakken met informatie bij de overheid opvragen en de overheid wil daar niet altijd aan meewerken of je krijgt informatie en komt erachter dat die niet goed is bijgehouden of dat je er gewoon geen goede conclusie uit kunt trekken omdat je er zoveel kanttekeningen bij kunt plaatsen. Dus het laatste is nogal vrij ingewikkeld. Maar het is in ieder geval de doelstelling van Nu om daar nu een tijdje mee aan de slag te gaan om te kijken van, hoe gaat dat nou. Ook omdat wij er nu mee aan de slag gaan wordt het ook steeds makkelijker, omdat we steeds vaker bij instanties data opvragen en ambtenaren enzovoort die raken er steeds meer mee bekend, die weten de weg van waar ze moeten zijn voor informatie. Door een aantal datajournalisten ook in te zetten - ik ben dan degene bij Nu en je ziet het op steeds meer plekken opkomen - en vaker om data te vragen wordt het ook makkelijker om die informatie te krijgen. En wat betreft het eerste: data visualiseren. Ik had eerst begrepen dat bij Nu de databerichten eigenlijk moeten overeenkomen met wat op de voorpagina staat op dat moment en dat je daarom ook heel snel moet werken. Is dat nog steeds zo? Ja, dat klopt nog steeds. Ja, het is eigenlijk heel logisch. Dat is het moment ook dat een bericht

147

NERD MET VIJF POTEN

MASTERSCRIPTIE JAN KRUIDHOF

nog het meeste wordt gelezen. Als een bericht net online staat, het moment dat de meeste mensen in dat bericht komen. Dat is de piek en daarna daalt dat steeds meer. Je moet zo snel mogelijk werken, dat geldt ook voor de redacteuren, je moet het zo snel mogelijk proberen aan te vullen met nieuwe informatie. Het heeft geen nut meer als je dat een halve dag of een dag later gaat doen. Dat geldt ook voor die grafieken. Op het moment dat je die grafieken moet bijvoegen moet het bericht gewoon nog zo vers mogelijk zijn. Dat is het moment dat de meeste mensen dat bericht nog lezen. Er zijn heel weinig lezers die eerst een bericht lezen en achteraf terugkomen van: Nou, misschien die wel gepdate zijn met recente informatie of een grafiek. Dus je moet er gewoon zo snel mogelijk bij zijn. Hoe lang heb je dan ongeveer? Twee uur? Sommige dingen kun je vooruitplannen, dus dat scheelt. Soms weet je dat een bericht eraan zit te komen, zoals bij de CBS-berichten. Op vrijdag krijgen we de CBS-agenda. Daar staan alle onderwerpen voor de volgende week in. CBS-cijfers worden elke dag om half tien s ochtends bekend. Dan is het vrij makkelijk om vrij te plannen. Je weet welk onderwerp op donderdag om half tien gaat langskomen. Om half tien exact staan die berichten erop. Dus om half tien is het F5 en terwijl je met je grafiek bezig gaat weet je dat er of bij het ANP of hier op de redactie ook iemand aan de slag gaat met de CBS-cijfers, want dat zijn vaak een of twee datasets per dag. En dat gaat vaak over vrij belangrijke dingen. Als het ANP niet besluit om er iets mee te doen kunnen we zelf nog besluiten om er iets mee te doen. Dus dat zijn dingen die je van te voren kan inplannen. Dus vaak is het een grafiek soms nog wel eerder klaar dan dat het bericht is getikt. Dan ben je het een beetje voor. Zodra het bericht online gaat kun je gelijk de grafiek er inknallen en ben je er als eerste mee. En soms is het gewoon haasten. Dus je kunt van tevoren ook al een beetje bedenken van: dit is zus en zon bericht, daar past zon soort grafiek bij.. Het handige bij het CBS is vooral dat de statistici die daar werken zien ook vaak wel de juiste nieuwsinsteek. Die pakken het belangrijkste er ook vaak als wel zelf uit. Dan kunnen wij heel geforceerd een andere insteek kiezen. Soms werkt het wel als je extra informatie zoekt in zon dataset en dan komt het een alinea eronder te staan, maar de hoofdmoot van het bericht blijft vaak wel hetzelfde. En kun je hun daar ook op - dit is zon vraag die vanzelfsprekend lijkt - maar kun je het CBS daar een beetje op vertrouwen of ben je er beducht op dat ze iets proberen te verhullen?

148

NERD MET VIJF POTEN

MASTERSCRIPTIE JAN KRUIDHOF

Het CBS is sowieso niet Het is een onafhankelijk instituut dus wat dat betreft hebben ze er niet echt belang bij om dingen te verhullen. Als je zelf verbanden ziet en je vraagt aan een CBSonderzoeker: Klopt dit? Dan hoor je die onderzoekers ook vaak van: Het zou best zo kunnen zijn, maar wij kunnen dat niet concluderen. Dat heeft gewoon met de hele correlatie causaliteit te maken. Je merkt gewoon dat onderzoekers bij het CBS er heel voorzichtig mee zijn om conclusies te trekken die niet kloppen. Als ik iets tegenkom wat niet klopt en ik bel naar het CBS wordt dat ook direct aangepast op de site. Maar de hoofdmoot van de berichten blijft eigenlijk wel altijd hetzelfde. Ik controleer het natuurlijk wel gewoon altijd als ik een dataset krijg, van, kan ik dezelfde conclusie eruit trekken of kan ik er misschien andere conclusies uit trekken. Maar weet je, het zijn ook niet enorm complexe datasets die in een keer worden vrijgegeven. Het gaat echt over een vrij specifiek gebied, een vrij specifieke periode. Soms verleng je de periode zelf en kijk je en dan denk je: klopt nog steeds, de conclusie, en het is misschien iets genuanceerder, maar bij het CBS weten dan vaak ook wel de genuanceerde conclusie te trekken van als het CBS zegt: Dit is het hoogste punt ooit, dan klopt het eigenlijk altijd. Zodra het ingewikkeld wordt zijn ze zelf ook wel wat genuanceerder en klopt het nog steeds wat ze eigenlijk zeggen. En als je iets hebt wat je niet vooruit kan plannen, welke stappen neem je dan allereerst in je hoofd zeg maar. Stel, er komt onverwachts data binnen. Of er is een onderwerp waar wel data aan te koppelen is. Het is eigenlijk bijna nooit zo dat er data binnenkomt. Weleens een persbericht waar wat getallen in hangen. Vaak moet je voor de rapporten er wel achteraanbellen, dus dat is vaak de eerste stap: kijken van wat, wat zouden hier berhaupt voor getallen achter kunnen liggen die we kunnen visualiseren. Als je bijvoorbeeld rapporten hebt waar een top tien lijstje in staat wil je weten op basis waarvan die top tien is gemaakt, welke getallen zitten erachter, kunnen we de hele Excel-sheet krijgen. Dat is meestal ook makkelijker om te vragen dan om de data vragen, een woordvoerder zegt dan: waar heb je het over. Maar als je zegt: we willen de Excel sheet achter het onderzoek hebben, dan is het vaak al een stuk makkelijker vragen. Daar zit ook meestal alle informatie in die ik nodig heb. Dat is eigenlijk de eerste stap: om informatie vragen. En vervolgens vragen: wat kun je hiermee? Wat is hier een goede visualisatie bij? Dan is het vaak heel makkelijk om naar de standaardvormen te grijpen. Aan de ene kant omdat dat sneller werkt - een lijngrafiek, een staafdiagram of soms een kaartje, dat is vrij makkelijk te bepalen wanneer je wat moet inzetten. En het is voor lezers ook heel goed herkenbaar. Als je hele ingewikkelde arty farty dingen gaat

149

NERD MET VIJF POTEN

MASTERSCRIPTIE JAN KRUIDHOF

maken - dat kost je heel veel tijd, maar lezers zijn ook gewoon minder geneigd om zoiets heel snel te begrijpen en dan kun je alleen maar bij hele grote projecten doen en dan heb je iets meer tijd om zoiets te laten bezinken van, goh, ik kan nu deze keuze maken, oke, maar misschien iets langer over nadenken. Het is vaak gewoon makkelijker om uit zon poule van standaard visualisaties te graaien want dat communiceert gewoon veel beter en dat werkt sneller. En die andere kan van het verhaal, de data verzamelen, hebben jullie daar een achterliggend doel bij? Bij Sargasso zijn ze veel bezig met privacy, hebben jullie ook een bepaalde hoek waarin jullie zoeken? Nee, in het begin nog niet. We zijn heel erg, we schieten nu nog heel erg met hagel. We proberen zoveel mogelijk verschillende onderwerpen te raken. Dan kijken we waar we makkelijk data bij kunnen verzamelen. Dat is heel lastig om in te schatten waar al die data te halen vallen - welke beleidsgebieden, welke ministeries enzovoort. Dus we proberen nu heel veel verschillende onderwerpen uit en zijn van plan om dat na verloop van tijd iets meer in te perken en een aantal aandachtsgebieden: we vinden dit belangrijk bijvoorbeeld, economie, veiligheid en ehm, sport bijvoorbeeld, ik noem effe drie willekeurige gebieden. Van dit zijn gebieden die we belangrijk of we kunnen daar goede en betrouwbare data over halen of we merken juist dat het ingewikkeld is en we willen een voortrekkersrol bij hebben omdat het ons dan ook weer differentieert van andere nieuwsmedia die er ook mogelijk mee aan de slag zouden kunnen gaan. Dus we zetten nu heel breed in, alles wat in ons op komt aan onderwerpen proberen we nu data over te verzamelen en na verloop van tijd gaan we dat een paar keer evalueren. Waar moeten we ons vooral op richten? Dat betekent niet dat wie andere onderwerpen gelijk uitsluiten, maar wel dat we ons meer focussen op een aantal deelgebieden. Maar hoeveel dat er zijn en welke dat hebben we eigenlijk nog niet besloten. Baseer je dat dan op bijvoorbeeld bezoekersaantallen? Ja, ook. Maar ik kan me heel goed voorstellen dat technologie er eentje is die we er in houden, omdat we Colin hebben (onze redacteur die veel over technologie schrijft en goed is met getallen en ook vaak eigen getallen verzamelt) dus dat is ook een gebied waar we makkelijk cijfers in kunnen hebben, maar aan de andere kant, als we bij die technologieberichten veel visualisaties doen, dat is ook een categorie die op zichzelf heel populair is, een categorie die op de voorpagina staat, iets waar we ons mee onderscheiden van anderen van andere sites die over technologie schrijven. Er zijn niet veel kranten die enorm goed over technologie schrijven. Dat is dan iets waar we heel goed in kunnen worden. Dat is bijvoorbeeld een die we zouden kunnen kiezen.

150

NERD MET VIJF POTEN

MASTERSCRIPTIE JAN KRUIDHOF

Maar dat gaat dan in overleg met de redacteur. Goh, zie jij dat zitten. En natuurlijk ook met de chef en de hoofdredacteur. Het gaat ook gewoon informeel, als we bij een bureau staan. En heeft wat je zelf leuk vind ook invloed? Zou je de selectie persoonlijk kunnen sturen? Wat dat betreft ben ik denk ik wel makkelijk, dat ik het ook wel leuk vindt zodra het goed gaat en wij ons kunnen onderscheiden. Dus ik denk dat het bijna op hetzelfde neerkomt. Het is niet zo dat jij bepaalde onderwerpen heel interessant vindt? Ik zou het heel grappig om eens een onderzoek te doen met gaming, datajournalistiek en gamen, maar dat is puur omdat het een eigen interesse is. Het is dan maar de vraag of er heel interessante dingen uit te halen vallen. Dat denk ik niet zo snel. Maar dat is meer voor een keertje.. Nee inderdaad, ik denk niet dat wij de gamingdatajournalistiek ingaan, hehe. Dat zou wel heel tof zijn, maar zie ik niet heel erg zitten. Wat wil de bezoeker? Het moet gewoon communicatief zijn, heel duidelijk een boodschap overbrengen. Dat is gewoon onze Nu-bezoeker: gewoon mensen die snel het nieuws willen weten, die binnen anderhalve minuut een berichtje willen doornemen en het dan ook volledig willen snappen. Zo snel mogelijk nieuws. Dus ja, daar richten we ons eigenlijk gewoon op. Gewoon duidelijk een boodschap overbrengen. Moeten jullie onderwerpen per se nieuws zijn? Of zou het ook kunnen zijn wat op zich al bekend is en dan mooi in beeld gebracht wordt? Nee, voor ons is echt nieuws belangrijk. Ik kan me voorstellen dat een krant iets meer de achtergrond in kan, maar dat is niet onze kracht natuurlijk. Bij ons is het echt de kracht om het snelle nieuws te brengen en om.. We schrijven af en toe wel eens beschouwende stukken maar ook daar zit vaak een nieuwsmoment aan. Voor een krant zou dat denk ik wel heel goed werken, bijvoorbeeld een Guardian, die heeft dat, die hebben een hele andere insteek met hun website. Die kunnen ook veel meer beschouwender en vaak ook meer gewoon een data-onderwerp neerleggen en dan heel groot vraagteken erboven: Kan jij hier iets mee, lezer? Dat is niet des Nu om dat te doen, dat is ook niet onze kracht, dus die weg zouden we niet in moeten slaan. Of we zouden daar een Nu-stijl voor moeten vinden, maar.. Het zou ook gewoon tijd innemen van

151

NERD MET VIJF POTEN

MASTERSCRIPTIE JAN KRUIDHOF

het nieuwsgedeelte. Daar valt nog heel veel nieuws te halen. Is de doelstelling ook nog veranderd sinds het begin? Zijn jullie qua koers veranderd? Ik weet niet de exacte doelen die zijn ingesteld toen Jelle hier begon, maar dat zullen dezelfde doelstellingen zijn geweest. Ik weet wel dat Jelle in het begin heel erg veel bezig is geweest met, in plaats van dat hij zich op het nieuws kon richten en daar nieuws uit halen en dingen kon visualiseren, dat hij veel technische dingen moest uitzoeken. Welke gereedschappen gebruiken we, dat soort zaken. Daar ben ik nu ook nog wel mee bezig, we zijn bijvoorbeeld net overgestapt op een andere visualisatietool die ook op de app werkt en met grote projecten komt het ook op het technische neer, maar wat ik van Jelle begreep was dat het aan het begin veel meer was. Van hoe krijgen we dit berhaupt in het CMS werkend?. Daar lag toen heel erg de focus op. De doelstelling was toen wel hetzelfde, maar waar hij dagelijks mee bezig was was wel net even iets anders dan hoe mijn situatie nu is. Wat dat betreft is het nu allemaal net iets meer goed geregeld. Lijkt me ook logisch, gelukkig. Workflow. Heb je s ochtends een standaard? Wat het voordeel was toen ik hier begon.. Toen Jelle hier begon had hij niet echt een leermeester, maar toen ik hier kwam heb ik twee dagen met Jelle meegekeken. Ook technisch, hoe het systeem werkt en dat soort dingen. Dus dat scheelde heel erg. Ik was in ieder geval qua technische kennis, begon ik niet echt met een achterstand. Ik herken op zich wel wat Jelle zegt, qua workflow. Maar ik heb het idee dat dat bij heel veel redacteuren is. Als je aan redacteuren vraagt: wat is precies je workflow? Je bent elke dag bezig met andere onderwerpen en er komt nieuws tussendoor en dan moet je schakelen en improviseren. Dat is best lastig. Hoe mijn dag er globaal uit ziet is: ik kom hier s ochtends aan, ik weet dat om half tien de CBS-cijfers er zullen zijn, dus daar probeer ik al tijd voor vrij te maken, dat zijn gewoon vaste dingen en er komen altijd goede visualisaties uit. Gaat ook geen dag voorbij zonder.. Ja hoor, maar als enige vastigheid is dat zon beetje. Bijvoorbeeld gisteren en vandaag waren er bijvoorbeeld geen CBS-cijfers, behalve opeens gisteravond. Weet ook niet precies hoe dat zat. CBS-cijfers over afval ofzo, afvalverwerking. Stond nergens op de agenda. Maar was ook s avonds, dus toen werkte ik niet meer. Ehm, maar dat is eigenlijk de vastigheid die ik heb, van de CBS-cijfers. Tussendoor en ook van

152

NERD MET VIJF POTEN

MASTERSCRIPTIE JAN KRUIDHOF

tevoren op Nu kijken. We hebben nu weekvergaderingen, dus we weten ook welke onderwerpen er in de loop van de week aankomen, dus die kun je ook al een beetje vooruit plannen. En: die collega is daarmee bezig, kan daar data in zitten? Dus CBS-cijfers op vast moment, weekvergadering en ondertussen op Nu kijken. Welke berichten staan nu op de site en waar zou ik data aan kunnen toevoegen? Die modellen, ze hebben wel vaak terugkoppelingen, maar ook daar zul je merken.. Als je het schema zou volgen zou je denken: Ik zou nu ongeveer bij de dataverwerking moeten zijn, maar dan zit je in gedachten eigenlijk al bij de datavisualisatie. Soms zijn de dingen ook zo obvious, zo simpel. Ik weet ongeveer we die dataverwerking, ik moet het alleen nog even doen. Dat is gewoon handwerk in Excel. Maar dat je dan alvast nadenkt over de visualisatie en terwijl je nadenkt over de visualisatie denk je: Oh wacht, als ik nu deze vorm kies dan moet ik misschien.. Oh wacht, dan moet ik de getallen toch anders verwerken. En dan heb je weer een andere terugkoppeling. Het is leuk om daar een schema bij te hebben, maar dat is nadeel van elk schema: er zijn een heleboel uitzondering. Vind je ze wel nuttig? Ja, het communiceert makkelijk. Het is makkelijk om aan iemand uit te leggen van dit is ongeveer hoe ik werk. Kun je er ook van leren? Mm.. het zijn gewoon standaardschemas . Dat is bijna iedereen journalistiek project zo: je verzamelt informatie, je verwerkt informatie, je presenteert informatie. En dat verwerken kun je dan weer in meerdere onderdelen opsplitsen, maar het komt in de basis op hetzelfde neer: ontvangen, verwerken, zenden. Tja, daar kun je het niet erg mee oneens zijn. Zo werkt het nu eenmaal. Er is vaak wel terugkoppeling in: Terwijl je informatie aan het verwerken bent, krijg je feedback en moet je weer nieuwe informatie verzamelen. Dat soort dingen. Maar goed, dat is gewoon hoe het.. Het is een vloeibaar proces eigenlijk, het kan alle kanten omgaan. Toen ik dat las van Jelle, dacht ik: dat is een mooi scriptieonderwerp. Toen zag ik de workflowmodellen en dacht ik: mooie modellen. Maar dan praat je met journalisten en die zeggen al snel: Het zijn leuke modellen, maar zo werkt het niet in de praktijk. Het werkt wel zo in de praktijk, maar niet in dat vaste stramien. Het maakt ook niet uit of de bedenker van dat model wel of niet echt denkt dat het zo gaat in de praktijk - het is gewoon een

153

NERD MET VIJF POTEN

MASTERSCRIPTIE JAN KRUIDHOF

goed communicatiemiddel. Vaak zal het ook ongemerkt wel volgens zon model verlopen en dan sta ik er niet eens bij stil, waarschijnlijk. Je bedoelt: om te communiceren aan je collegas hoe je werkt of.. Ja, of bij een presentatie of voor academici, die zijn dol op modellen. Omdat je de werkelijkheid toch op een bepaalde manier moet uitleggen. En dan is een model, het woord zegt het al, een vereenvoudiging van de werkelijkheid. Zodra je iets vereenvoudigd haal je nu nuances weg en in de werkelijkheid heb je wel met nuances te maken. Ben je veel bezig met WOBen? Ja, we hebben Brenno de Winter hier vaak op de redactie rondlopen. De WOB is wel een lastige procedure natuurlijk. Je hebt journalisten die al voor elk wissewasje dreigen met een WOBverzoek, wat helemaal niet handig is, want soms is een telefoontje naar een woordvoerder of iets dergelijks veel makkelijker en veel sneller. Voor een WOB-verzoek moet je het sowieso eerst op andere manieren proberen te regelen. Vaak is dat voor jezelf ook sneller. En voor de overheid minder belastend. Omdat een WOB-verzoek een hele procedure is die je dan op gang zet kost het ook daar heel veel tijd en mankracht. Een telefoontje naar persoon kan ook heel veel bewerkstelligen. En vaak helpt het ook vaak om aan de telefoon te zeggen: Ik bel nu, ik weet dat ik u ook kan WOBen, dat jullie die informatie hebben. Maar voordat we dat gaan doen.. Ik vraag het nu gewoon even zo aan. Dat scheelt mij heel veel tijd, scheelt jullie heel veel tijd. Maar dien je vaak een WOB-verzoek in? Ja, we hebben pas nog een paar WOB-verzoeken.. We hebben ze opgesteld. We bellen ze nu na en zitten nu op het punt van: moeten we nu gaan overwegen om nu nog een paar telefoontjes erachteraan te wagen en effe iets meer druk te zetten of gaan we inderdaad die WOB-procedure opstarten. Met het risico dat het gewoon heel erg lang gaat duren, want dat wordt natuurlijk zo lang mogelijk gerekt tot alle mogelijke grenzen en dwarsgezeten. Dat wil je eigenlijk niet. Het duurt gewoon heel erg lang. Dat is gewoon klote, dat dat zo lang duurt en dat je dan exact alles moet verwoorden omdat je anders toch ergens tussen de letters door wordt genaaid. Dat is niet leuk. Dus probeer je dat gewoon te vermijden, maar dat is wel iets wat je in je achterhoofd houdt van: dit is ons ultieme middel om in te zetten. We zitten er nu een beetje tegenaan: Gaan we nu voor bepaalde onderwerpen wel of niet een WOB-verzoek indienen? En scrapen, doen jullie dat ook weleens?

154

NERD MET VIJF POTEN

MASTERSCRIPTIE JAN KRUIDHOF

Ja, wel een paar keer gedaan, ja. Gewoon op de simpelde manier: gewoon een plug-in in je browser installeren dat je HTML-tabellen makkelijk in een keer in Excel kun importeren. Ja, gebruiken we weleens inderdaad ja. Zijn wel een paar projecten waarvan ik denk: daar zouden we eigenlijk iets voor moeten bouwen. Maar soms is het van: Oh, daar staat allemaal informatie op de site en dat ga ik scrapen en moeilijk doen enzo. Ik heb dat n keer gedaan en toen dacht ik van: Misschien is gewoon handig als ik even een mailtje stuur naar die persoon met de vraag of ik het mag hebben. Er stond geen exporteer-knop ofzo, dus ik dacht: dit moet ik scrapen. Nou, gewoon effe mailen en die persoon is hier geweest en we hebben koffie gedronken en hij had die informatie gewoon op een USB-stickje staan. Ok, net zo makkelijk. Scrapen is niet zon ultiem machtsmiddel als de WOB natuurlijk, maar het is hier wel hetzelfde verhaal: als het makkelijk kan, waarom moeilijk doen? Maar ja, we hebben het wel een paar keer gebruikt ja. Want we moesten de informatie wel hebben en er werd traag gedaan. Maar we hebben het nog niet zo ingewikkeld meegemaakt dat we echt Python [programmeertaal, jk] nodig hadden. En werken jullie ook weleens samen met lezers, andere journalisten of blogs? Ehm.. Ik heb er een tijdje geleden over nagedacht dat het misschien leuk zou zijn om een grote enquete te kunnen uitzetten naar lezers. Het nadeel is wel vaak met dat soort dingen.. Data heeft een gloed om zich heen van: dit is objectief, alles hierin klopt perfect. Als ik zelf een enquete online zie staan denk ik vaak: Hoe kan ik dit gaan kapot maken? Allereerst even kijken hoe vaak ik dezelfde inzending kan sturen. Of als ik de enqute heb ingevuld, kan ik hem dan nog eens invullen? En nog eens en nog eens. En gelukkig - of helaas - zijn er wel meer van dat soort rotjochies. Het is heel moeilijk om een goede enqute te maken waar je ook controleert of alle informatie die je verzamelt representatief is, of het allemaal klopt.. We zitten er nu wel over na te denken of we dit kunnen inzetten, maar aan de andere kant: volgens mij moeten we niet gaan denken vanuit het gereedschap. Van: we hebben het gereedschap De Enquete en we moeten dat per se gaan inzetten. We hebben tot nu toe geen onderwerp gevonden waarbij we het goed konden inzetten. Een tijdje geleden zag ik bij Tweakers dat ze wel zoiets wilden doen. Die wilden toen via een mobiele app gaan meten wat de uploadsnelheden en downloadsnelheden zijn en verbindingssnelheden en dat soort zaken. Zag er op papier heel goed uit, maar ze merkten gewoon dat.. Ze hadden het goed aangepakt. Je hebt natuurlijk wel een heel specifiek publiek dat die app installeert dus je hebt sowieso geen aselecte steekproef meer, dus echt representatief is het op dat moment niet meer, maar goed. Daar kun je nog iets bij voorstellen. Maar daarna kwamen ze er door technische dingen achter dat het gewoon niet werkte. Hij moest dus meten of

155

NERD MET VIJF POTEN

MASTERSCRIPTIE JAN KRUIDHOF

je wel of geen verbinding had, maar het probleem was dat als je geen verbinding had hij die gegevens niet lokaal opsloeg. Hij verzond ze gelijk als hij verbinding had, maar als je geen verbinding hebt kun je het niet versturen. Dat is in feite de goede manier om zoiets te gaan meten, met alle kanttekeningen erbij, maar zelfs dan - met zon goede opzet - is het nog lastig om het helemaal goed opgezet te krijgen. Soms heb je wel het onderwerp.. Ik denk dat we gewoon een keer toevallig tegen een onderwerp aan moeten lopen. Van: we kunnen het op geen andere manier aanpakken dan met een enquete, hoe gaan we die enquete opzetten. Beetje wat The Guardian toen heeft gedaan met die bonnetjes. Dat was ook niet vanuit het gereedschap gedacht, van: We hebben dit gereedschap, waar kunnen we dit voor inzetten?, nee, het precies andersom. Het ging om die bonnetjes en er was geen enkele andere mogelijke manier om al die duizenden bonnetjes te controleren behalve door dat gereedschap in te zetten en daarmee het publiek te bereiken. Daar kon je ook niet echt mee klooien. Ze hadden het zo opgezet dat er niet mee te sjoemelen was, omdat er uiteindelijk een redactie achter zat. Je kon alleen maar aangeven: dit is verdacht en dit is goed. En zodra er volgens mij twee of drie mensen aangaven van Dit is een verdacht bonnetje dan werd die doorgestuurd naar de redactie en die ging er vervolgens naar kijken. Dus je had altijd een soort veiligheidsmechanisme. Het was ook geen enquete wat dat betreft. Zijn er ook onderwerpen die je wel zou willen gebruiken, maar waar je op een of andere manier nog niet aan toekomt? Ja, er zijn heel veel datasets die ik zou willen hebben. Er zijn ook heel veel datasets die niet worden vrijgegeven omdat het nieuws is. En je gaat als ambtenaar geen dataset vrijgeven als je er de volgende dag mee om de oren wordt geslagen in de krant of op Nu. Dat doe je niet. Dus er zijn heel onderwerpen. Wat ik net zei: wapenvergunningen, ben ik al tijdje mee bezig. En we zitten er heel dichtbij telkens, maar of die persoon is net op vakantie of Ja, ik heb maandag overleg met de persoon die erover gaat, daar ga ik het neerleggen en dan mail ik je terug, word je niet teruggemaild, gelijk terugbellen, in gesprek, hele dag in gesprek. Oke, dag daarna weer bellen. Weer in gesprek. s Middags weer proberen. Ik heb het bij hem neergelegd, daar gaan we je nog over op de hoogte houden. Week later weer bellen.. En die data is wel openbaar, die is niet geheim? Nee, daar zit is geen privacygevoelige informatie in. We willen het ook niet op postcodeniveau of

156

NERD MET VIJF POTEN

MASTERSCRIPTIE JAN KRUIDHOF

straatniveau hebben, maar we willen het echt op gemeenteniveau. Het is tot in zekere mate geanonimiseerd. Het is informatie die beschikbaar is, dat hebben we ook al gehoord in n van de eerste gesprekken. Die informatie is wel beschikbaar, zei ik heel blufferig, terwijl ik het niet zeker wist of ze het op die manier hadden gendexeerd. Ja, we hebben dat inderdaad, we hebben het ook op straatniveau. Dan weet je: Ik weet dat ik het tot zo specifiek kan krijgen. Maar dan krijg je dus die gesprekken van ik ga je nog mailen en weer bellen en zo gaat het de hele dag heen en weer. Op een gegeven moment voeren we de druk steeds verder op en dat is het: Ok, dit is het allerlaatste telefoontje. We kunnen het nu gaan regelen of we gaan een WOB-verzoek sturen. We hebben Brenno de Winter die daarmee kan helpen. Die naam kennen ze inmiddels wel? Brenno kent heel veel mensen en heel veel mensen kennen Brenno, dus dat scheelt weer. Dus op een gegeven moment moet je misschien een beetje een lul worden. Ik weet niet zo goed.. Op die manier moet je gewoon die informatie zien los te krijgen. Want dat is ook informatie waar we recht op hebben. Dat is informatie waar we met zijn allen voor hebben betaald en die heel veel zegt, zeker nu met die schietpartijen. [De schietpartij in een bioscoop in Aurora ligt vlak achter ons, jk.] Nu hoeven we daar in Nederland niet zo snel zorgen over te maken, want het is totaal niet te vergelijken met Amerika. Maar als het informatie is over het aantal wapens dat in jouw gemeente.. Waarom zouden we dat niet mogen weten? En hele saai, economische informatie wel? Ik kan wel heel goed begrijpen dat een politieagent daar ook een beetje huiverig voor is. Want misschien blijkt er wel uit dat ze hun werk niet goed doen. Of dat het aantal verstrekte vergunningen is gestegen en het aantal delecten ook en dat ze een verkeerd beleid voeren. Weet ik veel allemaal. Maar dat is gewoon informatie waar we recht op hebben. Dus, ja. Duurt alleen eventjes. En zijn er ook nog technieken die je graag zou willen gebruiken? Jelle zei dat de visualisaties die hij gebruikte zichtbaar moesten zijn op desktops, tablets, mobieltjes enzovoort. Is dat voor jou ook zo? Ja, we hadden eerst Fusion Charts, waar we visualisaties mee maakten. Lijngrafieken, staafdiagrammen. Dat werkte met Flash, dus dat werkte niet op iPads en ook niet op de mobiele app. Die hebben we laatst geswitcht naar HighCharts, dat gewoon javascript is en overal op werkt. Waarbij we vervolgens ook weer moeten kijken hoe we dat precies gaan schalen, want we laten het in een iframe zien, maar de breedte van de website is anders dan de breedte van de app enzovoort. Je moet oppassen dat verschillende programmeertalen niet met elkaar in de knoop

157

NERD MET VIJF POTEN

MASTERSCRIPTIE JAN KRUIDHOF

komen. Dat moet je ook allemaal uitzoeken enzo. Maar dat hebben nu redelijk goed gedaan. De standaarvisualisaties kunnen we nu goed vertonen op alle apparaten. Het gaat weleens een keertje mis, maar dat is dan weer iets waar we aan kunnen werken en dan overleg ik met de mensen van techniek. Goh, hebben jullie tijd om daar een keertje naar te kijken? We hebben het heel druk! Nou, volgende week dan misschien? En dan is het opgelost. En heb jij nog dingen die jij nog heel graag wil proberen, maar dat past niet bij Nu of daar is geen geld voor? Nee, qua geld heb ik sowieso nooit beperkingen gehad, wat dat betreft. Nu zijn de meeste tools ook gratis, dus dat scheelt heel erg. Je zou bijvoorbeeld met een vormgever willen werken.. Wat dat betreft zijn er misschien twee beperkingen. De eerste is: we hebben een kolombreedte die vergeleken met andere websites best wel smal is. Dus we moeten daar ook rekening mee houden als we visualisaties maken. Voor de EK-visualisatie heb ik toen een aparte pagina gemaakt. Dat is eigenlijk de enige oplossing waarop we die konden weergeven. In het bericht zelf - ben ik het nu serieus vergeten? - nee, 400 pixels. Is het echt maar 400 pixels? 400 of 500.. Volgens mij 410, even uit mijn hoofd. Maar goed, dat is een beperking gewoon en daar moet je rekening mee houden. Zo is de website nu eenmaal en voor echt grote projecten moeten we kijken of we daar misschien een template-pagina van maken. Of misschien een andere manier, een pop-up ofzo. Maar dat is ook weer met advertenties en andere zaken en doorklikken lastig. Maar die kolombreedte is gewoon een beperkende factor. Een andere is: ik ben een journalist die een klein beetje kan programmeren. Een beetje copypast-programmeren. Beetje Frankensteincode maken. En dan werkt het soms en meestal niet en dan schakel ik weer hulp in. Internet is wat dat betreft heel genadig, van: We helpen je wel even. Er zijn heel veel bronnen waar je dan terecht kan of iemand die een bepaalde library heeft gemaakt die hij dan kan mailen bijvoorbeeld. Dan heb je mailcontact met een of andere gigantische programmeerheld die het belangeloos voor je oplost. Ik heb er nog even iets extras voor gemaakt en als je het toch weer terugverandert moet je dit en dat aanpassen. Fuck, vet gaaf. Dat is wel voor mijzelf een beperking, dat ik dat niet uit mijzelf kan doen. Maar aan de andere kant: ik weet niet of ik dat per se moet willen. Op een gegeven moment houdt het gewoon ergens op, dat ik er zoveel tijd in moet steken dat het niet meer efficint is om het door mij te

158

NERD MET VIJF POTEN

MASTERSCRIPTIE JAN KRUIDHOF

laten doen. Dat het gewoon makkelijker is om hier iemand van Techniek in te huren of iemand van buitenaf aan die klus te laten werken, die het dan in een halve dag of een ochtend heeft geregeld. Dat is erg een beperking, gewoon je eigen kunnen eigenlijk. Dat zei Dimitri trouwens ook. Een programmeur is 80 euro per uur en een journalist is veel goedkoper. Dan moet je ook denken: wat is het beste? Wat ik zelf vaak doe is kijken: welke librarys zijn er al beschikbaar? Dan heb je alvast een beginpunt om mee te beginnen. Hoe kan ik een library goed omschrijven? Normaal gesproken begin je met programmeren vanaf het begin, dus moet je alle algoritmes zelf schrijven. Bijvoorbeeld als je een algoritme wil schrijven van: Ik wil een cirkel tekenen en die cirkel moet op een gegeven moment van positie x,3 naar positie x,0 bewegen en ondertussen van y,0 naar y,5. Normaal gesproken zou je al die programmeertaal zelf moeten uitschrijven en een goede library is eigenlijk een verzameling code die heel veel dingen van tevoren al heeft vastgesteld. Dus daar hoef je alleen maar in te vullen: Cirkel, begintpunt x, beginpunt y, volgende punt x, volgende punt y, heel simpel gezegd. Je hebt ook veel ingewikkeldere librarys, zodra het interactief wordt, waarbij een heleboel andere effecten bij komen kijken. Maar een library is gewoon een van tevoren vastgelegde berg code, eigenlijk. Het voordeel van een goede library is vaak dat er ook heel veel voorbeelden in zitten. Dat is waar ik dan vaak naar kijk. Iemand heeft dan een hele taal uitgeschreven, eigenlijk, en dat dan bovenop een bestaande programmeertaal. Eigenlijk wordt ook geen taal uitgeschreven, maar een heleboel wetten, eigenlijk. In Javascript, jadajadajada, alles wat er achter ligt hoef je verder eigenlijk niet meer naar te kijken. En op basis van die wetten hebben ze dan visualisaties en voorbeelden gemaakt. En daar kijk je dan vaak naar, wat is interessant voor grote projecten? Daar kun je dit en dit mee weergeven, is misschien interessant voor de politieke verkiezingen straks. Dit is wat voor dit onderwerp, kan ik het aanpassen? Op internet kijken of er al andere mensen mee bezig zijn geweest. Kan ik er iets aan toevoegen? Op fora kijken: ik heb deze code, kan iemand mij even helpen? Naar welke sites ga je dan voor hulp? Stack Overflow (http://stackoverflow.com/) is een hele goede. Dat is waar heel veel programmeervragen al zijn opgelost. Voor specifieke zaken kun je er vaak ook code op dumpen. Je hebt een andere site, jsFiddle (http://jsfiddle.net/), daar kun je dan vaak hele

159

NERD MET VIJF POTEN

MASTERSCRIPTIE JAN KRUIDHOF

programmeertaal ingooien. Die website bestaat eigenlijk uit een aantal vensters: in het ene venster gooi je al je code, dan heb je een venster waar je visualisatie alvast wordt getoont en zodra je iets aan de code verandert en je drukt op run dan heeft hij dat weer aangepast. Gewoon een soort van coderen op internet en meerdere mensen kunnen ook aan datzelfde stuk programmeercode werken. Dus dat gaat vaak een hele tijd zo heen en weer. Dan heb je een vraag en iemand op Stack Overflow weet het toevallig. Als iemand het daar niet weet zit ik weer bij een bepaalde maillijsten, bijvoorbeeld die van NICAR-IRE. Dat is vaak meer specifiek echt op datavisualisatie, Stack Overflow is meer voor programmeren. Die mailinglijsten zijn meer: Ik moet iets in Excel doen, Heeft iemand goede voorbeelden van een kaart. Iets journalistieker? Ja, klopt. Dus dat zijn een paar van die bronnen waar je een beetje tussendoor kan pendelen en kijken of je daar je vraag krijgt beantwoord. En als het echt niet lukt, ja, dan houdt het op een gegeven moment ook op. Dan ben je in tussentijd misschien, omdat je je zo hebt verdiept en zoveel voorbeelden hebt zien langskomen, heb je misschien veel betere ideeen gekregen om het misschien eenvoudig op te lossen. En ook sneller. Dan probeer ik het deze keer op die manier op te lossen, maar een volgende keer.. Maar dan ben je toch een paar stappen vooruit gekomen. Over jou persoonlijk: je kwam op het idee voor RegioHack bij.. ..SETUPs Hacking Journalism bijeenkomst. Was je daarvoor al met datajournalistiek bezig? Niet mee bezig, maar ik had er wel eens van gehoord. Ik wist dat ze bij Nu een datajournalist zochten. What the fuck, wat is dat eigenlijk? Dat was vlak voor SETUP, Jelle was toen al aangenomen. Ik had er daarvoor al wel eens over gehoord en ik wist dat ze bij The Guardian iets met data hadden gedaan maar dat was heel abstract enzo en ik was toen eigenlijk nog maar net afgestudeerd en kort aan het werk bij de regiokrant, dus dan ben je heel erg bezig met andere nieuwe dingen in je leven. Het zal dan best dat er ergens iets met datajournalistiek gebeurt en dan weet je wel dat het op zich interessant is, maar dan is het nog niet van: Daar ga ik diep in duiken. En toen kwam SETUP en toen dacht: Ik weet dat het interessant is, laat ik er gewoon naartoe gaan, dan kijken we wel of het echt zo interessant is. Dat bleek dus van wel. Je bachelor was Industriele Vormgeving. Heb je daar ook soortgelijke dingen gedaan? Dat is heel grappig, want ik ken wel een paar oud-klasgenoten die nu ook naar de

160

NERD MET VIJF POTEN

MASTERSCRIPTIE JAN KRUIDHOF

datavisualisatiekant zijn gegaan. Niet voor journalistiek, maar vaak voor bedrijven of interfaceontwerp. Datavisualisatie zelf is natuurlijk al wat ouder. Er zijn nu heel veel dingen bijgekomen dat het nu interactiever is geworden en er is veel data die er eerder nog niet was. Dus vroeger was het ook heel veel handwerk en nu kun je veel meer dingen automatiseren. Het is makkelijker en moeilijker geworden, tegelijkertijd. We hebben wel wat lessen interfaceontwerpen gekregen en statistiek. Wat wel nuttig was, was dat ik wel een halve betaachtergrond.. Industrieel ontwerp zitten tussen beta en vrije kunsten in. We kregen echt hardcorde wiskunde. Dat ik dacht: Wat moet ik hier in godsnaam mee, dit is echt super abstract. Ik zag echt niet wat ik daar in de praktijk mee moest. Daarna had je een watermeloen voor de klas staan en die gingen ze door midden snijden en moest je gaan kleien en met houtskool gaan klooien. Twee colleges op die manier na elkaar. Mm.. ok.. En nu het verband graag. En dat had je een projectgroep en dan kwam het ongeveer bij elkaar. Maar nooit helemaal per se. Maar die beta-achtergrond is wel heel nuttig geweest. Er zijn wel wat journalisten die beta zijn, maar hier op de redactie zijn het ook vooral mensen die bij Nederlands, politicologie, economie vandaan komen. Economie is al een groot voordeel omdat je dan al veel met getallen bezig bent, maar sommige mensen hebben ook HBO journalistiek gedaan. In de regiojournalistiek heb je ook veel mensen die HBO hebben afgerond. Die zijn journalistiek heel goed onderlegd, maar die hebben geen beta-achtergrond. En dat is mijn voordeel wel, dat ik iets beter met getallen kan omgaan. Nu zal ik nooit een statisticus of een wiskundige kunnen aftroeven, dus ik zal zo iemand graag om hulp vragen als ik het zelf niet snap, maar ik kan iets meer zelf oplossen. En makkelijker met die persoon in gesprek treden. We hebben hier een standaarddeviatie.. Ok, ik snap wat je bedoelt. Ik zou het niet kunnen narekenen per se, maar ik weet in ieder geval wat ze bedoelen. Dat scheelt wel, dat je in ieder geval met elkaar kunt communiceren. Maar in Enschede was niet echt een vak Datavisualisatie, van we hebben deze en deze getallen, hoe breng ik dat in beeld. Wel heel veel dingen die eraan verwand waren. Lineaire algebra enzo. Dus ik weet wat een matrix is en hoe een matrix werkt. Het is een beetje weggezakt, maar ik weet de basisdingen wel. Interfacedesign hebben we wel een beetje gehad, maar die echte klik daartussen niet. Dat kwam meer in de master daarna. Het is wel grappig dat veel klasgenoten ook in de datavisualisatie zijn gerold, veel commerciele klussen, of eigen bureautjes hebben opgericht. Met een ander doel dan journalistiek, maar wel hetzelfde proces. Wat doet Nu na publicatie? Past je hetzelfde artikel ook aan als er nieuwe informatie is? We hebben natuurlijk vaak cijfers die na een tijdje worden ververst. Een tijdje geleden hebben

161

NERD MET VIJF POTEN

MASTERSCRIPTIE JAN KRUIDHOF

we een discussie gehad. Stel je voor dat het gaat over voedselprijzen, graanprijzen. Dat wisselt telkens. Stel dat we daar twee maanden geleden een artikel over hadden, natuurlijk tot dat moment. Maar stel dat we nu weer een artikel hebben, dat de graanprijzen enorm zijn gestegen. De discussie ging erover of we dan het oude artikel ook gaan updaten. Dat doen we uiteindelijk niet. Dan krijg je een beetje een rare archieffunctie. Dan zou je eigenlijk alle oude berichten op die manier moeten aanvullen met vernieuwde informatie. Zo van: we hadden eerst bericht dat iemand ziek was. En een week later is iemand weer minder ziek. Dan maken we wel weer een nieuw bericht dat hij minder ziek is, maar we gaan niet in het oude bericht ook nog zeggen: Hij was later weer minder ziek. In data is dat ook lastig, want dan heb je een grafiek bij het bericht dat de graanprijzen enorm hoog zijn. In die grafiek zie je een piek. Maar als je dat up-to-date houdt zie je die grafiek daarna nog heel lang doorlopen. Dat is voor een lezer niet heel erg logisch, dat je die grafiek daarna nog door laat lopen. Dus dat doen we sowieso niet. De versie die we dan in het artikel stoppen, tot die datum, die gaan we daarna niet nog een keer aanvullen. Dat zou heel raar zijn. Dan zou je dat bij bijna alle grafieken moeten doen, want heel veel grafieken zijn tijdseries. Als we ergens een fout in hebben gemaakt, bijvoorbeeld een fout getal, dan moeten we dat sowieso natuurlijk oplossen en zo snel mogelijk. Ook een week later, dan moeten we dat gewoon verbeteren, maar dat lijkt me vrij logisch. Dat zouden we anders ook rectificeren. Nou is er een ander ding: het CBS maakt vaak schattingen. Soms hebben ze dan historische data en dan weten ze gewoon dat dit dat getal is, bijvoorbeeld inflatie. Van de afgelopen paar kwartalen heeft het CBS niet echt een schatting, maar ook niet echt een feit, dat hangt er een beetje tussenin: ze hebben dan een getal aangehouden voor de inflatie, maar dat kan nog een paar procentpunten schelen. Als je een kwartaal later kijkt is dan in plaats van 4,1 misschien 4,0 geworden. Nou pas ik die in feite ook niet aan. Dat doen we ook omdat we op dat moment die CBS-cijfers krijgen. Dat is wat het CBS op het moment dat het artikel wordt gepubliceerd schat, wat betreft de inflatie. En het kwartaal daarna kloppen die cijfers wel weer. Dus op het moment dat de lezer het meest recente bericht leeest hebben ze ook weer die cijfers. Maar de laatste kwartalen zijn dan weer een soort schattingen. Staat er dan ook bij dat het een schatting is? Er staat niet altijd in elk artikel: Het CBS heeft hier een asterixje bij geplaatst. Als ik het kan dan doe ik het wel hoor. Maar het is ook een beetje de vraag hoe ver je moet gaan, want vaak kloppen die cijfers gewoon. Het wordt niet vaak in het kwartaal erna weer gecorrigeerd. Dus je zou heel veel kanttekeningen moeten plaatsen voor iets wat eigenlijk niet eens verandert.

162

NERD MET VIJF POTEN

MASTERSCRIPTIE JAN KRUIDHOF

Is er nog iets wat betreft de workflow dat we nog niet hebben behandeld? Ehm.. Dat zul je misschien zelf ook al hebben gemerkt. Het is best wel lastig om een workflow te bedenken. Het is natuurlijk een gebied wat heel erg in opkomst is. Er zijn journalisten die het niet heel erg leuk vinden als ze horen: Datajournalistiek, dat is net in opkomst, want er zijn een heleboel mensen al langer bezig met.. Dick van Eijk reageerde inderdaad al op een van jouw stukken, over de geschiedenis van datajournalistiek. Ook wel ergens terecht hoor, want hij heeft er wel een punt mee. We moeten niet denken dat onze generatie het wiel uit heeft gevonden. Er wordt al heel lang met data en getallen omgegaan. Dus dat was ook wel een hele goede toevoeging van hem, dat Nieuwe Reporter-artikel. Maar aan de andere kant: datajournalistiek, de vorm waarin het nu gebeurt, is wel helemaal nieuw. Tien jaar geleden had je niet al die interactieve tools beschikbaar, je had niet die enorme bakken aan data. Er was wel data beschikbaar, maar het was niet zoveel en van zulke hoge kwaliteit. En je had die interactieve tools niet, dat scheelt gewoon heel erg veel. En die tools zijn ook nog gratis. Vroeger moest je daar veel vaker voor betalen. Dus de instap is ook een stuk lager geworden. Maar omdat er zoveel tools zijn en zoveel mogelijkheden - datavisualisatie buiten datajournalistiek onploft nu ook echt, een heel bruisend veld is. Er gebeurt zeker iets nieuws. Dus de datajournalistiek zoals we dat nu kennen is wel heel erg nieuw. Zou je daar niet twee termen voor moeten hanteren? Dat kan me verder niet zoveel schelen, maar dat maakt het aan de andere kant wel lastig. Daardoor heb je wel een hele nieuwe workflow, hele andere competenties die je moet hebben. Dick van Eijk en andere - met respect - oude rotten in het vak, kunnen vaak wel programmeren enzo, maar die komen wel vanuit een ander veld daar naartoe. En je merkt dat je dingen net even iets anders benadert of uitwerkt. Dat houdt het allemaal heel spannend, maar dat betekent wel dat voor echte datajournalistiek zoals we dat nu kennen - alle interactieve zaken - heb je wel een iets andere workflow. Je moet iets meer zoeken. En omdat het allemaal zo nieuw is weet nog niet iedereen wat die workflow is. Er komen ineens zoveel modellen, omgekeerde piramides en allemaal dingen, dat is best wel lastig, want ja, als je hiermee aan de slag moet gaan, waar moet je dan in godsnaam beginnen? Dat is lastig en wat mij betreft is het antwoord gewoon: ergens beginnen. Een dataset pakken en er een beetje mee aan gaan klooien. Kijken of je er iets in kan vinden. Kijken waar je vastloopt. Waar zit vooral het verschil?

163

NERD MET VIJF POTEN

MASTERSCRIPTIE JAN KRUIDHOF

Heel plat: print en internet. Niet dat het een beter is dan het ander. Want sommige dingen in print zijn echt ongelofelijk mooi en zou je nooit online kunnen doen. Het klinkt heel raar, maar in een krant heb je een hogere resolutiedichtheid dan op je beeldscherm. Je kan dus veel meer details weergeven. In inkt kun je veel fijnere beeldpunten plaatsen. Je zou het misschien ergens kunnen uitrekenen. Maar in print kun je hele kleine, priegelige letters weergeven. Sinds de nieuwe iPads en Macbook Pros met hoge resolutie schermen kun je veel meer details zien. Kun je ook verder inzoomen. Nu heb je in print nog steeds een hogere resolutie en kun je meer details weergeven. Dat is het grote voordeel. Maar je bent statisch, je kan maar een dataniveau weergeven. Je hebt een heel andere manier van de data benaderen en verwerken. Je werkt naar een ander product toe, uiteindelijk. Online kun je meerdere datalagen maken. Je kunt het interactief maken, maar aan de andere kant moet je ook weer rekening houden dat je niet te priegelig kan gaan werken omdat het op je beeldscherm is. Maar elk beeldscherm is niet hetzelfde, kan groot of klein zijn, kan ook een telefoon zijn. En je bent met interactieve tools bezig, dus je bent bezig met Fusion Tables, wat je voor print misschien minder snel zou gebruiken. Je hebt dus iets andere wetten. Je hebt ook in het dagelijks werken. Op een papieren krantenredactie werk je in een andere routine dan op internet. Op internet is het: direct online, zo snel mogelijk. Bij een krant kun je soms wat meer je tijd nemen en heb je soms wat meer tijd om artikelen te plannen, ook al heb je daar soms ook heel hectische dagen, waar dingen zo snel mogelijk af moeten. Bijvoorbeeld omdat de achterste paginas van een krant dicht moeten en toevallig heb jij daar net een artikel gepland en daar hoort een visualisatie bij en dan moet dat ook zo snel mogelijk. En als die pagina dicht is kunnen we naar de voorpaginas kijken, anders krijgen we die nooit af. Zit er een eindredacteur in je nek te hijgen. Er zitten gewoon een heleboel verschillen tussen. Op wat voor redactie werken, naar welk eindproduct werk je toe. En ja, Dick van Eijk werkt voor de papieren krant en ik voor Nu, wat internet-only is.

164

NERD MET VIJF POTEN

MASTERSCRIPTIE JAN KRUIDHOF

Anke Vellenga (NOS)

Allereerst: jouw officile titel is toch informatiespecialist? Ja, dat klopt. Wat houdt dit precies in? Ik werk op de afdeling Documedia. Aan de ene kant doen wij research. Dus: als journalisten achtergrondinformatie of beeld nodig hebben, dan zoeken wij dat voor ze op. En het andere deel is archiveren van het beeldarchief en tekstarchief. En tekstarchief is dan wat wij in uitzendingen hebben gehad zetten wij in het systeem zodat we makkelijk kunnen terugvinden welke onderwerpen we allemaal hebben uitgezonden. En dat is alleen voor televisie trouwens, dat tekstarchief. En ongeveer een jaar geleden ben ik begonnen met het opzetten van datajournalistiek bij de NOS, want er werd eigenlijk niet iets aan gedaan. Op zich bestaat datajournalistiek al vrij lang, weet je waarschijnlijk ook inmiddels. Maar niet dat het zo genoemd wordt en actief gedaan wordt. Dus al bestaat het al langer.. Niemand was er mee bezig. En de oudere varianten, rondneuzen in Excel? Waarschijnlijk wel, dat wordt altijd wel eens gedaan denk ik. Dat is maar net hoe het uitkomt, als er een verhaal met cijfers komt zal dat vast wel gebeuren, maar het was geen speciaal, ingebed iets. En op welk moment dacht jij: hier ga ik in duiken? Was dat in deze functie? Het is nog steeds buiten mijn gewone functie, ik doe dit allemaal in de tijd die ik hier over hou. Dat is misschien sowieso wel goed om te weten, dat wij hier niet echt een datajournalist in dienst hebben. Ik kom daar nu misschien het dichtste bij. En er is iemand bij NOS op 3 met NOS op 3 Lab mee bezig, maar die doet het ook maar een paar dagen per week en die houdt zich ook bezig met innovatie: datavisualisatie en innovatie doet hij. Dus wij werken wel samen, maar er is niemand die dat fulltime doet. Het moment dat ik dacht: Hier ga ik mee beginnen, was vorig jaar ergens. Een expertisedag voor onderzoeksjournalisten. Daar was een presentatie van Hack de Overheid. Toen dacht ik: Dat is inderdaad interessant en daar zouden wij wel wat mee kunnen doen. Ik dacht dat het ook

165

NERD MET VIJF POTEN

MASTERSCRIPTIE JAN KRUIDHOF

wel bij onze afdeling zou passen. Toen ben ik een paar maanden later naar The Guardian geweest in Londen, toevallig. Ik ging eigenlijk naar een vriendin en toen dacht ik: Dan kan ik net zo goed bij The Guardian vragen of ik even mag langskomen en dat mocht. Dus toen heb ik gevraagd hoe hij, Simon Rogers, dat heeft opgezet. En toen dacht ik: Dat ga ik ook gewoon doen. En wat voor tips kreeg je mee? Hij heeft een beetje verteld hoe zij zijn begonnen. En hij vertelde dat hij ook heel veel in zijn vrije tijd heeft gedaan om dat op te zetten, want ook die hoofdredactie dacht: Dat kost tijd en geld en dat hebben we niet, dus hij dacht: Ik doe het gewoon in mijn eigen tijd en dan zeg ik wel dat het niet zoveel geld kost en dan laat ik ze wel zien wat er allemaal uitkomt. Uiteindelijk heeft hij ze overtuigd en nu werken ze er met een stuk of vijf mensen, alleen aan datajournalistiek. Dus toen dacht ik: Ja, dat is inderdaad een manier, gewoon beginnen en mensen overtuigen. En toen kwam je terug.. Een paar maanden later is de werkgroep opgezet. Het was juli dat ik er was en in oktober hadden we het eerste werkgroepoverleg. Dat duurt hier altijd een tijdje, want het zijn mensen van verschillende redacties en iedereen werkt in verschillende diensten, dus voordat je een keer een groep bij elkaar hebt duurt dat weer een paar weken. Maar in oktober hadden we toen het eerste werkgroepoverleg. Daar zitten mensen van verschillende redacties in. Van Documedia, Nieuwe Media, verschillende redacties: Binnenland, Buitenland, Economie, NOS op 3, Digidesk (de internetredactie) en de mensen van NOS Net (die ook meer met sociale media bezig zijn). Wat is dan het verschil tussen Nieuwe Media en NOS Net? Nieuwe Media faciliteert meer wat er mogelijkheid is op de website. Dus die doet inhoudelijk niets, maar die maken de website of applicaties. Meer de techneuten? Ja. En NOS Net doet vooral ook dingen voor internet, maar ook wel eens voor tv. Met mensen, ooggetuigen bijvoorbeeld. Of dat ze een deskundige groep maken en enquetes uitsturen. Zij onderhouden de band met het publiek via internet? Ja. Laatst met Vraag het Den Haag hebben zij ook meegewerkt.

166

NERD MET VIJF POTEN

MASTERSCRIPTIE JAN KRUIDHOF

En jij hebt toen NOS-breed een mailtje uitgestuurd met de vraag wie er mee wilde doen? Nee, ik heb wel mensen uitgekozen met wie ik het er daarvoor over had gehad en die dat interessant vinden. En als je het er dan met mensen over hebt dan hoor je wel: Oh, dan moet je die ook uitnodigen want die vindt dat ook wel interessant. En zo krijg je uiteindelijk wel een groepje bij elkaar. En hoe groot is die groep nu precies? Ik denk ongeveer vijftien mensen. Halverwege is het ook uitgebreid met twee mensen van Nieuwsuur. Daar is dan ook weer een meisje mee bezig, Lieke Kwant. En die zitten dan ook bij ons. [Lieke] heeft wat meer ruimte gekregen [voor datajournalistiek]. Het verschil met Nieuwsuur is dat zij meer de echt journalistieke verhalen maakt. Dus wel op zoek gaat naar datasets en dat analyseert en dan er verhalen van maakt. Maar zij hebben een andere soort site dan ons, dus zij kan heel weinig kwijt qua visualisaties. Bij hun is het meer vanuit het verhaal werken. Hoe ontstaat een datajournalistiek item precies? Gisteren was de eerste keer dat we die treemap online hebben gezet. Er moeten nog wel wat dingen aangepast worden. Maar eigenlijk was het idee om een tool te hebben waarbij je makkelijk dingen kan vergelijken en verhoudingen kan zien. En om dat op een originele manier te doen. En je hebt wel gratis tools, zoals ManyEyes waarbij je ook een treemap kan maken, maar die is heel lelijk met embedden. Eigenlijk was er niet een goed alternatief. Dus toen hebben we besloten om er eentje te laten maken. Als wij een tool laten maken.. Wij willen dat herbruiken. Het moet makkelijk te maken zijn. Maar meestal ben ik degene die dat maakt of mijn collegas van Documedia. Niet dat je elke keer opnieuw hoeft te programmeren. Dat is nu gemaakt en gisteren hebben we het voor de eerste keer online gebruikt. Dat was dus eigenlijk vanuit het idee van een visualisatie. Bedenken jullie dat bij Documedia? Want ik neem aan dat er ook andere mensen met die informatie bezig zijn. Is er NOS-breed overleg? Nee, niet NOS-breed. Dat is ook wat is lastig vind aan het productieproces [van de treemap]. Ook waar ik trots op ben, omdat het iets van onszelf is. Maar het verliep moeizaam omdat de communicatie beter had gekund. Het proces was zegt maar: wij hadden het bedacht, de treemap willen we de eerste keer online hebben met Prinsjesdag. Er is een mail over geweest, wie wat

167

NERD MET VIJF POTEN

MASTERSCRIPTIE JAN KRUIDHOF

gaat doen voor radio en tv en daar stond onze treemap ook tussen. Nog contact over gehad met de coordinator. Maar ondertussen hadden ze bij Economie ook bedacht van: Wij willen een visualisatie die die begroting weergeeft en die zijn naar NOS op 3 gegaan. Dus daar is een stagiaire een dag bezig geweest om daar een visualisatie van te maken. Op een andere manier, maar wel van de Rijksbegroting. Dus eigenlijk ga je op twee manieren iets visualiseren. Dat was een beetje dubbel. Inhoudelijk is er verder niet iemand bij geweest. Bij de Haagse redactie wisten ze ervan. Uiteindelijk hebben wij het bij Documedia zelf gemaakt. En de Digideskredactie zet het dan uiteindelijk op de website. Daar waren ook weer problemen mee, met het systeem. Dat zat ook allemaal niet mee. En jullie hebben dan ook zelf die vormgeving gedaan?Of heeft een extern bedrijf dat gedaan? Wij hebben dat is inderdaad een goede dat laten doen door een extern persoon, eigenlijk. Maar je hebt het zo aangeleverd gekregen dat je volgend jaar de cijfers kan invoeren en dat het direct klaar is? Ja, of je kan het voor allerlei dingen gebruiken. Hopelijk gaan we het vaker dan een keer per jaar gebruiken. En Nieuwe Media heeft trouwens ook nog meegewerkt, in samenwerking met die externe programmeur, om het mogelijk te maken op de site. Ik weet niet meer precies hoe dat allemaal werkt, ik ben niet technisch aangelegd. Maar dan had hij een ZIP-bestand met allemaal dingen. Een basiscode met allerlei dingen ofzo en dat heeft Nieuwe Media dan weer gedaan. Wat veel stappen moet je dan doorgaan zeg. Ja, ik heb ook even een printje voor je gemaakt. Dankjewel! Het is niet zo dat we ons altijd aan die stappen houden, maar over het algemeen wel. Dus jullie hebben wel een soort algemeen stappenplan? Ja, dit hebben we ook met de werkgroep opgezet. We houden ons niet helemaal vast aan het schema. Maar op zich gaat het meestal wel zo. En bij ons is misschien ook het verschil.. Die andere zijn echt datajournalist en die zijn in hun eentje of samen met een programmeur. En bij ons is het echt een samenwerkingsproces over de hele redactie. En wij hebben eigenlijk geen datajournalist en ook geen programmeur. Dan moet je dat toch zo een beetje oplossen. Maar

168

NERD MET VIJF POTEN

MASTERSCRIPTIE JAN KRUIDHOF

zoals gister.. De eerste stap is: je gaat naar Documedia en redactie en media gaan overleggen over een visualisatie of idee. En diegene van de economieredactie heeft dat dus al niet gedaan, die is gelijk naar NOS op 3 gegaan. Dus het moet nog wel misschien beter duidelijk gemaakt worden. Bij de NOS is zon workflow dus meer noodzakelijk Anders wordt het een chaos. Hebben jullie als werkgroep ook een bepaald doel voor ogen? Wij zijn eigenlijk begonnen vanuit de visualisatie. Dus: hoe kun je verhalen waar al cijfers in voorkomen, mooier presenteren voor mensen en inzichtelijker maken en dat mensen kunnen uitzoeken: Wat betekent dit nieuws nu voor mij persoonlijk? Dus dan denk je vooral uit de visualisatie en niet per se uit de data want die is er al, die hebben de redacteuren al. Maar eigenlijk wil ik nu wel meer die kant op vanuit de data.. Dat je inderdaad op zoek gaat naar data en daar probeert nieuws uit te halen. Dus dan is het weer het doel om iets naar boven te brengen wat mensen nog niet weten. En vervolgens als het nog uitkomt en mogelijk is om daar dan een visualisatie van te komen, maar dat het begin van het verhaal de dataset is. Want bijvoorbeeld die cijfers over die wapenvergunningen.. Jerry Vermanen was daar ook mee bezig en die zei dat het verschrikkelijk lastig was om die data te krijgen. Jullie is het dus gelukt. Ben je daar lang mee bezig geweest? Ik heb daar helemaal niets aan gedaan, eigenlijk, dus ik ga niet met de eer strijken, haha. Maar de redacteur die die specialisatie heeft is er wel een tijdje geweest, inderdaad. Uiteindelijk heeft hij het niet via de WOB hoeven doen, maar hij heeft er wel veel moeite in gestoken. En dat was een idee van Documedia? Dat was zijn idee. Hij zei: Wij krijgen een dataset met alle wapenvergunningen van Nederland, wat kunnen wij ermee gaan doen? Dus hij heeft die dataset aan ons gegeven. Dat was echt megagroot. We hadden uiteindelijk drie Excel-bestanden nodig, anders paste het gewoon niet in Excel. En uiteindelijk hebben wij dat geanalyseerd bij Documedia, of eigenlijk ik. We hebben dat geanalyseerd en gekeken: Wat kunnen we hier nu uithalen voor nieuws? Dat bleek nog best lastig te zijn. Toen hebben we er zelfs ook nog deskundigen bij gehaald. Wat ook een belangrijk onderdeel is, denk ik wel, van datajournalistiek. Dat staat hier niet in het werkproces, maar dat is wel zo denk ik. Maar die [deskundigen] zeiden: Eigenlijk zit hier ook helemaal geen nieuws

169

NERD MET VIJF POTEN

MASTERSCRIPTIE JAN KRUIDHOF

in. Want wij wilden weten hoeveel automatische en semi-automatische wapens zijn er nou in omloop in Nederland. Maar dat viel niet uit die dataset te halen. Het beste is om al die wapens in het echt te bekijken, maar dat is natuurlijk niet mogelijk. En het type en kaliber en merk stond er wel bij, maar daar kun je niet uit ophalen of ze semi-automatisch zijn. Want ze kunnen verbouwd worden. Ze vergeleken dat met Volkswagen Polo, dan heb je ook verschillende varianten weer en dat heb je ook met wapens. Dus dat was een beetje jammer. Maar op zich was het wel een keertje echt datajournalistiek. En uiteindelijk hebben we het wel gebruikt, gekoppeld aan een verhaal over Alphen aan de Rijn. We hebben ook een dataset en dit zijn de gegevens die erin voorkomen, mannen, vrouwen, schietsport, jachtsport. En die redacteur was van Binnenland? Ja. Maar hij heeft wel een specialisatie in, beetje politie.. Veiligheid? Ja. Hij gaf die dataset aan jullie. Hoe begin je dan met analyseren? Eerst ordenen. Eerst proberen een beetje te begrijpen: wat is het, wat staat er allemaal in? En uiteindelijk heb ik dus.. Excel was niet handig omdat je dan drie keer alles moet doen en dan weer bij elkaar optellen. Uiteindelijk heb ik een deel in Acces kunnen doen. En we toen nog een systeem aangeschaft. Liquid heet dat, LQD. Daarmee kun je veel grotere datasets importeren en analyseren. Dus je kunt het opschonen, ordenen, structureren. En dan kun je dus makkelijk gegevens eruit halen, van: hoeveel wapens zijn er in de regio Amsterdam-Amstelland? Of: hoeveel mannen hebben nou een wapen en hoeveel vrouwen? Daarmee hebben we het uiteindelijk geanalyseerd. En moet je je zoekvraag dan programmeren? Nee, je hoeft niet te programmeren. Het is juist een heel makkelijk, simpel systeem. Het is een beetje slepen en filteren, eigenlijk. Selecteren. Het ziet er een beetje uit als Excel, maar het is makkelijker. En het is geen rekenprogramma, wat Excel eigenlijk wel is. Het is echt een programma om data te structureren, te ordenen. En die deskundigen waren wapendeskundigen? Ja, van de politie.

170

NERD MET VIJF POTEN

MASTERSCRIPTIE JAN KRUIDHOF

En was het makkelijk om die erbij te krijgen? Ik heb dat dus ook niet geregeld, dat heeft die redacteur die die contacten al heeft geregeld. En ik had niet het idee dat dit voor hem moeilijk was, maar misschien omdat ze al contact hadden. En hij had ook van een van hun ook die dataset gekregen. En ze vertelden ook heel open hoe ze daar nu bezig waren sinds Alphen aan de Rijn om die wapenvergunningen in kaart te krijgen. Want dat was nadat gebeurd was nog niet zo geregistreerd en nu zijn ze ook aan het nadenken: Hoe kunnen we dit wel in beeld krijgen ook met automatische en semi-automatische wapens? Daar heeft hij ons ook open over verteld. Dit was dus wel een succesverhaal? Voor mij persoonlijk in ieder geval wel, omdat het eindelijk een keer een echt datajournalistiek verhaal is. Vanuit de data en niet van Oh, wat voor mooie visualisatie past hierbij. Wij hebben uiteindelijk ook visualisaties gemaakt, maar dat was niet het startpunt. En het was een goede samenwerking, met die redacteur en de deskundigen erbij. Is de doelstelling ook bijgesteld sinds jullie zijn begonnen? Ontdekken jullie als werkgroep wat wel en niet werkt? Eigenlijk lopen we de hele tijd tegen dat soort dingen aan. We zijn bijvoorbeeld ook begonnen met: welke tools kunnen we gebruiken. Dan blijken bepaalde tools toch niet zo mooi of handig te zijn. Maar eigenlijk had ik voor mijzelf altijd al het idee van, dat onderzoeksjournalistieke is wel iets waar ik uiteindelijk op wil uitkomen. Dus het niet heel erg duidelijk veranderd, ofzo. Het is meer de uitwerking die aangepast moest worden. En we hebben sowieso niet echt een hele sterke doelstelling. Het is nog niet gembed in onze organisatie. Het is nog steeds een beetje in de orinterende fase, van bovenaf. Ik zit er middenin, maar we worden nog niet echt erkend van hogeraf. Nu is er die jongen van NOS op 3, die ermee bezig is om te kijken hoe we ermee verder kunnen, maar voor hetzelfde geld houdt dat ook op. Dat is ook maar tijdelijk? Ja, tot januari geloof ik. Dus dan kun je wel allerlei doelen hebben, maar als dat niet.. Onderwerpen. Hebben jullie ook specifieke onderwerpen waar jullie graag wat mee willen doen?

171

NERD MET VIJF POTEN

MASTERSCRIPTIE JAN KRUIDHOF

In principe is alles mogelijk. We hebben verschillende redacties. De economieredactie is hier ook veel mee bezig, dus economische verhalen is mogelijk. En binnenlandse natuurlijk. Laatst heb ik nog iets voor buitenland gemaakt. Buitenland is wel iets minder, maar persoonlijk vind ik dat heel interessant, om daar juist wel mee bezig te gaan. Dat is nog wel iets om aan te werken, maar in principe is het voor alle onderwerpen geschikt. Zijn er onderwerpen die jou persoonlijk erg aanspreken? Ja, inderdaad buitenlandse onderwerpen. Ontwikkelingssamenwerking. Conflicten. Zijn er ook bepaalde websites die data uitbrengen die je in de gaten houdt? Ja, af en toe. Het is niet echt regelmatig of op vaste tijdstipppen, maar als ik een keer tijd over bekijk ik wel eens een aantal websites, of daar nog iets interessants op staat. Dat kunnen buitenlandse dingen zijn, zoals WHO [Wereld Handelsorganisatie] en UN [Verenigde Naties], Wereldbank, van alles. Of bij The Guardian zelf, daar hebben ze natuurlijk ook allerlei datasets. En Nederlandse: overheid.nl, onderwijs, wij hebben wel een rijtje. En kijk je ook vaak naar de CBS-site? Ook CBS inderdaad. Maar is het ook zo dat je die echt elke dag of wekelijks checkt? Nee, maar dat is dus alleen als ik tijd over heb. En dat is de laatste tijd niet echt.. Maar CBS is inderdaad een goede, ook omdat ze een agenda hebben van wat er gaat komen. Dat hebben andere organisaties ook wel, VN enzo. Dan zou je eventueel als je iets interessants ziet, dat alvast kunnen inplannen. Dat is hier ook altijd lastig. Heel vaak moet iets op het laatste moment gebeuren en dan komt het soms net niet goed uit. Heb je ook wel eens dat je van tevoren al zegt: Die dag ga ik daar mee bezig? Je kan wel een beetje inplannen. Ik heb nu een keer in de week een dienst waar ik mijn tijd vrij mag indelen en dat is meestal datajournalistiek. Dus dan zou ik dat kunnen doen. Maar ik heb tot nu toe niet iets gezien waarvan ik zeg: Daar moeten we echt mee bezig. Dat is ook wat bij doelstelling hoort: als jullie iets brengen moet het dan per se nieuws zijn? Eigenlijk is dat wel het uitgangspunt. Persoonlijk vind ik dat we best meer aandacht mogen besteden aan de achtergronden. Uiteindelijk heb ik dat ook gedaan met het HIV-verhaal en de

172

NERD MET VIJF POTEN

MASTERSCRIPTIE JAN KRUIDHOF

wapenvergunningen. Want er zat niet echt nieuws in die dataset. Maat het verduidelijkt wel veel dingen. En voor mensen kan het ook persoonlijk interessant zijn dat ze kunnen zien: Wat gebeurt in mijn regio of met mijn leeftijdsgenoten? Zou dat bij de NOS passen, denk je dat je dat erdoor krijgt? Ehm.. Ik denk zelf van wel. Maar ik denk dat het beleid niet zo is. Dat wil ik ook nog even duidelijk maken. Eigenlijk is bij NOS nu internet first. Eerst was tv first, nu is internet first. En de website is vooral een nieuwssite. En voor de internetredactie is het ook lastig om achtergrondartikelen te publiceren op de website. In het laatste nieuws-blokje heb je dan een achtergrondverhaal, dat klopt eigenlijk niet. Voor hun is dat lastig om weg te zetten. Ik zei al: welke onderwerpen zou je willen behandelen die niet bij de organisatie passen. Dat zijn dus meer die achtergrondverhalen? Ja. Eigenlijk wel. Maar niet specifieke onderwerpen. Wat zijn voor datajournalistiek de voor- en nadelen van deze organisatie? De samenwerking tussen verschillende disciplines vind ik echt een voordeel. Dus dat je dan vanuit de redacteur inhoudelijk input krijgt. Wij hebben weer meer verstand van datasets en hoe je datasets kan vinden. We missen alleen een beetje een technisch persoon. Maar de internetredactie weet weer wat er allemaal mogelijk is op de website. Technisch als in: een programmeur? Ja, een programmeur. We hebben wel programmeurs bij Nieuwe Media natuurlijk, maar die werken meer op lange termijnprojecten. Die kunnen niet even snel ingezet worden voor een visualisatie die morgen af moet. En een nadeel vind ik dat er geen officile coordinator is, die fulltime met datajournalistiek bezig is. Dat het nu vooral naast het gewone werk gedaan moet worden. Heb je wel, als je met collegas praat van andere afdelingen, het idee dat ze de waarde van datajournalistiek inzien? Ja, hier op de vloer wel, zeker. Veel positieve reacties en mensen zien ook echt het nut wel. Alleen van bovenaf is het wat lastiger. Weet je dan ook wat ze precies lastig vinden?

173

NERD MET VIJF POTEN

MASTERSCRIPTIE JAN KRUIDHOF

Ze willen het dan wel gelijk allemaal goed hebben. En ik heb ook het idee dat ze het ook niet helemaal honderd procent begrijpen. Zij hebben het ook druk met allerlei verschillende dingen, dan staat dit niet zo hoog op hun prioriteitenlijstje, volgens mij. Erik Bloem zei:Datajournalistiek is soms meer wetenschap dan journalistiek. Nu wordt er gediscussieerd over de waardering van de NOS voor wetenschap. Heeft dit hier ook mee te maken? Nou, ik denk dat sowieso van onderzoeksjournalistiek in het algemeen het beeld bestaat dat dit veel tijd kost en weinig oplevert. En dat zij dat hierbij ook hebben. Ik heb het er wel eens met de hoofdredacteur over gehad en dan zegt zij: Maar wat ga je dan doen? Wat voor nieuws ga je dan brengen? Ja, dat weet ik nu nog niet. Ze wil direct resultaat zien. Ja. En dan kan ik mij van haar ook wel voorstellen dat ze daar niet zomaar geld aan gaat besteden. Maar ondertussen.. Ik ga nu gewoon proberen aan te tonen wat we allemaal kunnen, maar dat is lastig als je er niet fulltime mee bezig kan. Je kan hier natuurlijk moeilijk zeggen: Ik ga twee weken ergens mee bezig en misschien levert het niets op. Nee. En nu hebben we dus hele beperkte middelen en dat schiet ook niet op, met resultaten die je dan kan laten zien. Heb je wel een budgetje gekregen? Nee. Wel voor de treemap bijvoorbeeld of de pensioenvisualisatie. Technieken. wobben, scrapen, doen jullie dat soort dingen ook? Sommige journalisten gebruiken de WOB wel natuurlijk. Scrapen zou ik heel graag zelf kunnen, maar dat kan ik niet. Dat wil ik wel leren, maar er is niemand die dat eigenlijk kan. Ook een gemis. Dat zou een programmeur wel even voor je kunnen doen. Werken jullie ook samen met andere partijen, bijvoorbeeld met hackathons? Doen wij ook niet. Wij hebben wel eens het idee gehad hoor, wij willen nog wel eens een hackathon ofzo organiseren. Maar weer: tijd, geld.

174

NERD MET VIJF POTEN

MASTERSCRIPTIE JAN KRUIDHOF

En werken jullie ook nog met andere programmas samen dan Nieuwsuur? Nee. Zou ook nog een optie kunnen zijn. Sta ik wel voor open, maar is er nooit van gekomen eigenlijk. Samen sta je natuurlijk sterker. Dat vind ik wel mooi aan de datajournalistiek in Nederland. Datajournalisten staan wel open voor samenwerking en kennis delen. Dat is wel gaaf. Ik mail ze ook wel eens van: Ik heb geen idee hoe dit moet, weet jij het? En dan leggen ze het gewoon uit. Wat betreft updates: bij een nieuwe ontwikkeling plaatsen jullie gewoon een nieuw bericht, neem ik aan? Ja, dat hangt er vanaf hoe lang na die tijd het is. Meestal vullen we het de eerste paar dagen nog wel aan. We hadden bijvoorbeeld eens iets met tandartstarieven en een tandarts met hele hoge tarieven had zijn tarieven ook aangepast. Ja, dan passen wij dat ook aan. Maar mailen ze ons zelf, dat iets niet klopt, dan passen we dat ook aan. Laatst hadden we een enqute met mensen in het buitenland en een paar weken later waren er nog mensen die er heel graag bij wilden, toen hebben we dat ook gedaan. Dat was een kleine moeite. Maar bijvoorbeeld UWV-cijfers, die krijgen we nu elke maand. Dan maak ik een kaartje van de werkloosheidspercentages per gemeente. Dat maak ik gewoon elke maand opnieuw. En dan maak ik een nieuw artikel. En dat plaats je dan in een dossier of onder een tag? Nee, dat is iets waar we ook aan willen werken. Hoe je dat terugvindt op de site of hoe je dat kan ordenen. Maar daar wordt nog aan gewerkt. Denken jullie bij Digimedia bij datajournalistiek ook aan een specifiek medium? Meestal ben ik vooral bezig met de visualisatie en dat is vooral voor internet. En de redacteur of verslaggever mag nadenken wat hij op radio en televisie gaat doen. En daarbij hebben we op televisie ook een paintboxafdeling, die in principe de infographics, plaatjes, kaartjes voor televisie maakt. Werken jullie veel samen met de paintboxafdeling? Nee. Dat zou misschien wel moeten. Dat zou handig kunnen zijn, omdat ze sowieso meer kennis hebben van grafische vormgeving en wat handig is en wat niet, maar op zich komt dat er steeds niet van. Als je hun kennis van 3D-visualisaties combineert met datajournalistiek..

175

NERD MET VIJF POTEN

MASTERSCRIPTIE JAN KRUIDHOF

..kun je hele gave dingen doen. Maar het enige wat ik dan zou kunnen doen is de data aanleveren. Snappen zij die data ook goed of zijn het meer grafisch vormgevers? Ik weet het niet honderd procent zeker, maar volgens mij zijn zij meer vanuit de grafische hoek en hebben ze minder verstand van data. En het is natuurlijk het mooiste als iemand n journalistieke kennis n technische kennis n grafische kennis heeft. Ja, en die combinatie is moeilijk te vinden in n persoon. En vandaar dat ik denk dat samenwerking uiteindelijk de beste oplossing is. Wat betreft de medewerkers. Jij bent vanuit de opleiding bezig geweest met informatie. Ja, niet met data, maar wel met informatie. [Lachend] Ik weet alles van data. Een informatieprofessional, noemen ze dat. Om wat voor informatie moet ik denken? De opleiding heet Informatie, Dienstverlening en Management, aan de Hanzehogeschool. En tijdens die opleiding leer je eigenlijk hoe je met informatie omgaat en hoe je dat kan managen in een organisatie. Het is ook helemaal niet op journalistiek gericht, tenminste niet die opleiding. Je leert zeg maar vooral ook organisaties adviezen geven hoe zij met hun informatie om kunnen gaan. Archiveren, wat de werkprocessen zijn met informatie. Maar niet echt: Ga een Excelbestand analyseren ofzo, dat hoefden wij niet. Maar wel researchen: wat zij dan betrouwbare bronnen en wat niet? Of business intelligence, dat hadden we toen wel. Dat is eigenlijk ook een soort van datajournalistiek, maar dan meer voor het bedrijfsleven. Toen dacht ik wel: Oh, dat is wel heel interessant. Maar toen zag ik dit nog niet voor me. Ik zag dat je ook bij het Algemeen Dagblad en RTL hebt gewerkt. Was dat ook te vergelijken met datajournalistiek? Bij RTL was het archiveren en researchen en bij het AD alleen maar research. Weet je toevallig ook bij RTL wat er is gebeurt met Jelle Kamsma? Volgens mij weet Jelle dat zelf niet eens. Ik heb het hem wel gevraagd en heb hem ook wel eens gesproken daarna, maar waarschijnlijk hadden ze toch andere ideeen over hoe zij die

176

NERD MET VIJF POTEN

MASTERSCRIPTIE JAN KRUIDHOF

datajournalistiek daar wilden invullen en heeft er zich hogerop iets afgespeeld, maar volgens mij weet hij dat zelf ook niet. Ik ben wel benieuwd hoe RTL haar datajournalistiek nu wil aanpakken. Toevallig, die mensen van mijn oude afdeling de Documedia-afdeling ook zeg maar, Documentatie die hebben mij ook gevraagd: Misschien willen wij er ook wel wat mee doen, wat zou jij ons dan voor tips geven? Ik weet niet hoe ver ze inmiddels zijn, maar ze zijn zich wel aan het verdiepen. Want ik denk dat informatiespecialisten best wel wat kunnen bijdragen aan datajournalistiek. En de andere mensen van de werkgroep, hebben die een soortgelijke achtergrond of zijn het allemaal journalisten? Mijn directe collegas hebben dezelfde opleiding gevolgd en de anderen zijn van allerlei verschillende redacties. Die hebben journalistieke achtergrond. Hugo van der Parre is natuurlijk een onderzoeksjournalist. Gert-Jan Dennekamp is natuurlijk verslaggever met een economische achtergrond. Maar geen echte nerds, kort door de bocht? Wij weten hoe je data moet zoeken en analyseren en ik snap ongeveer hoe je moet scrapen, maar om het echt te doen, dat wordt lastig. Dat is wel een gemis. Je zei al dat je bij The Guardian langs bent geweest. Zijn er nog andere organisaties waarvan je de kunst een beetje kon afkijken? Ik denk dat je voor elke organisatie moet kijken wat voor jou het beste werkt. We zijn ook zo megagroot, dat werkt ook niet echt mee. Heb je het idee dat een gewone verslaggever het datajournalistieke aspect van data zou herkennen als hij tijdens zijn werk op data zou stuiten? Ja. Niet bij iedereen, maar meestal komen ze dan wel even naar mij toe: Ik heb iets met eh.. cijfers. En af en toe vraag je ook wel eens: Heb je nog een leuk verhaal? Heel praktisch: zitten jullie in dezelfde ruimte? Ja. Op een grote redactievloer.

177

NERD MET VIJF POTEN

MASTERSCRIPTIE JAN KRUIDHOF

Zijn er nog dingen die we nog niet behandeld hebben? [Kijkt door vooraf gemaakte aantekeningen.] Nee, we hebben eigenlijk alles wel gehad. Het belangrijkste is er nu niet een datajournalist echt fulltime hiermee bezig is, bij ons. En een technisch persoon. Dat is het grootste probleem. Toch gek, je zou denken dat je in zon grote organisatie wel n persoon vrij kan maken. Maar dan moet je toch door allerlei lagen. En het duurt een eeuwigheid voordat er een keer een beslissing wordt genomen. Want er moet overlegd worden en het moet allemaal strategisch en op beleidsniveau uitgewerkt worden. En voordat je, wat ik eerder al zei, hier een groep mensen bij elkaar hebt, ben je alweer een tijdje verder. Tot slot: als er iemand bij jou zou komen zoals jij bij Simon Rogers kwam, en vroeg om tips. Wat zou je dan zeggen? Ook gewoon: beginnen. Kijken hoe ver je komt. Laat zien wat je kan. En de samenwerking vind ik heel belangrijk. Probeer samen te werken met collegas die er ook interesse en enthousiasme voor hebben. Dat eigenlijk.

178

NERD MET VIJF POTEN

MASTERSCRIPTIE JAN KRUIDHOF

Jasper Koning - Nederland van Boven

Een ding wat wel handig is om vooraf te zeggen: ik heb in een paar interviews over Nederland van Boven al de vraag gehad: Wat hebben jullie nu journalistiek ontdekt? Wat is jullie datajournalistiek? En daarmee meteen een waarschuwing: wij hebben niet aan datajournalistiek gedaan, wij hebben echt datavisualisatie gedaan. Je hebt waarschijnlijk een vragenschema en misschien dat we her en der vastlopen omdat we er ook pas zelf gaandeweg het project achter zijn gekomen dat dit echt een verschil is. Datajournalistiek en datavisualisatie. Ik kom er met een huidig project achter dat het alleen al lastig is om te bedenken: waar zijn we naar op zoek? Er zijn zoveel databronnen. De doelstelling. Hoe is het programma ontstaan? Zagen jullie Brittain from above en Deutschland von oben en dachten jullie direct: dat gaan we ook doen? Het project Nederland van Boven als geheel is Nederland op een manier laten zien zoals een kijker/bezoeker het nog nooit eerder heeft gezien. En dat aan de hand van spectaculaire helicopterbeelden en datavisualisaties. Wat we voor ogen gehad hebben is: wat je niet met een heli kunt filmen, daarvoor heb je datavisualisatie. Dus we proberen dat aanvullend te laten zijn op de helicopterbeelden. Om een voorbeeld te geven: het bootverkeer voor de haven van Rotterdam, dat speelt zich af over 24 uur. Als je dat filmt zie je geen wegen in de zee lopen, maar dan zie je gewoon enkele boten. Als je 24 uur boten afspeelt zie je opeens hele duidelijke patronen, dat kun je niet filmen en wel met data tonen. Dus dat was een doel, om datavisualisatie toe te passen. En wat we wilden toevoegen aan Duitsland en Engeland is dat wij echt wel veel meer een verhaal wilden vertellen. Bij BBC zit een visualisatie over taxis en dan zeggen ze ook in Brittain from above: Kijk, in de spits nemen taxis allemaal binnendoorwegen. En vervolgens zie je daar in die visualisatie helemaal niets van. En dat was bij ons wel een trigger: Nee, er moet wel een wisselwerking zijn tussen voice-over en datavisualisatie. Dat moet kloppen en er moet een verhaaltje in zitten, hoe klein en hoe dun ook. Dat is wel iets wat we hebben willen toevoegen. Dus ik denk dat dat onze doelen zijn geweest. Dat was wat je in de eerste vergaderingen.. dat ontstaat na verloop van tijd. Er is een ding van Brittain from above, daar ga je mee aan de slag, je hebt een X aantal gesprekken, je gaat kijken: Wat is dat eigenlijk, datavisualisatie?. Na een paar slagen kwamen we bij het bedrijf dat ze voor Brittain from above en Deutschland von

179

NERD MET VIJF POTEN

MASTERSCRIPTIE JAN KRUIDHOF

oben ook heeft gemaakt, dus zijn we daarmee in gesprek gekomen. Wat is daar goed gegaan, wat kan daar nog beter? Die puzzelstukjes vormen uiteindelijk je hele verhaal. De bedoeling was dus niet om nieuws te brengen, maar inzicht bieden in wat je niet kunt zien? In die zin nieuws, dus wel op een nieuwe manier naar Nederland kijken. Zoals je niet eerder naar Nederland hebt gekeken. Maar wat heel vaak is.. Als boten in een bepaalde vorm voor de haven van Rotterdam varen, dat is iets wat je op zich wel kan bedenken, dat hoeft niet heel schokkend te zijn. Maar op het moment dat je het ziet en met data inzichtelijk maakt, juist omdat je het niet kan filmen, is dat wel nieuw en kan dat wel verrassend zijn. Dus het is eerder dat de verrassing gezocht werd dan echt het nieuwe. En dat zit ook in Eeen visualisatie waar heel veel reacties op kwamen is die van de meeuw die van Texel 300 kilometer.. In principe is het een stipje dat van Texel naar Amsterdam vliegt. Het is niet wereldschokkend, maar het brengt wel bij veel mensen het besef: Jemig, een foto vliegt dus in een dagje van Texel naar Amsterdam, met de gegevens erbij dat dit 300 kilometer is op een dag en dat dat is om zijn jongen te voeren. Dat gehele samenspel van info en beeld en visuaslisatie, dat maakt dat het iets wordt waar mensen van denken: Jeetje, dat wist ik nog niet en zo had ik het nog niet eerder gezien. En daar ben je continu naar op zoek, naar een nieuwe manier van kijken. Wat denk je dat mensen echt raakt? Ik denk dat het een wisselwerking is tussen dat het er heel gaaf uit ziet die visualisaties zagen er gewoon heel tof uit. Wat de truck is en wat ik mij kan herinner.. Tegelijk met dat wij bezig waren was PBS bezig met America Revealed. Daar kreeg ik van dat bedrijf een animatie van te zien, van pizzakoeriers die pizzas bezorgen in New York. En wat me daar opviel was dat een van de redactrices ook zei: En nu gaat hij naar huis. En toen was het opeens geen opgloeiend stipje meer, maar toen was het echt een pizzakoerier. En ik denk dat als dat lukt, dat die opgloeiende stipjes in een keer een verhaal krijgen en daardoor persoonlijk worden ik denk dat dat bij die meeuw ook heel goed is gelukt, dat het niet meer een stipje was maar een verhaal werd dat dat heel erg werkt. Dat is n. En aan de andere kant, tenminste wat mij zelf in ieder geval en dat misschien toch meer een mannelijk ding is gewoon de pure complexiteit in beeld weten te brengen. Zoals met vliegbewegingen: de hoeveelheid vliegtuigen, de enormiteit daarvan. Massaal wordt Nederland bevlogen en daar met een camera heel spectaculair doorheen en dat dan er gewoon heel tof uitziet. Het gevoel dat je hebt bij Discovery met Big Machines en dat soort dingen?

180

NERD MET VIJF POTEN

MASTERSCRIPTIE JAN KRUIDHOF

Ja, dan is het gewoon the impact. Dus ik denk dat dat een mannelijke appeal is en dat verhaal/persoonlijke meer de vrouwelijke appeal is. Had je dat van tevoren al bedacht? Nee. Dat was ook geen doelstelling: we willen de mannen zus bereiken en de vrouwen zo? Nee. We hebben wel in ons hoofd gehad: Dit zou iets kunnen zijn wat snel heel technisch wordt en Discovery-achtig en hoe zorgen we dat dit ook voor vrouwen interessant is? Maar die meeuw heb ik heel lang op de plank gehouden omdat ik wist.. Technisch gezien was dat de makkelijkste animatie om te maken: het is gewoon n GPS-track. Dus het is alleen maar camera. Het enige waar je mee bezig bent is om voldoende met die camera om die ene punt heen te draaien, dat er nog iets gebeurt in beeld. Maar het was technisch eigenlijk heel simpel. En dingen als treinverkeer, botenverkeer, vliegverkeer, ja de waren heel ingewikkeld en daar zijn we heel lang mee bezig geweest. En daar moet je veel meer over het verhaal nadenken. Ik hoorde ook al dat je al die punten dan weer handmatig moest invoeren, zodat een trein over het spoor rijdt en niet dwars door een woonwijk. Ik denk in die zin, dat ik het meest trots nog wel ben op die van het treinverkeer. En omdat het technisch heel moeilijk was om die data helemaal te berekenen, maar ook omdat we daar de data ook echt bewerkt hebben voor het verhaal. We hebben gezegd: we gaan eerst alle treinen vanuit Groningen naar Leeuwarden op Utrecht laten afkomen, dan uit Amsterdam, dan uit Den Haag/Rotterdam. En zo al die windstreken allemaal op Utrecht af laten komen. Dus zo hebben we echt een flinke bewerking.. Want in het eerste shot toon je maar een vijfde van de data en daarna het andere stuk en daarna het andere stuk. Dat is sowieso al iets dat je wel moet bedenken. Van: We kunnen ook de helft weglaten. Dan kunnen we daar wel met een camera overheen gaan en dat dan als eerste shot.. Dat is gescript, dat is in scene gezet, dat is bedacht, daarvan wisten hoe lang elke scene moet duren. Dan zoom je in op Utrecht en zie je al die wissels heen en weer gaan. Dat is een los databestand. Dan zoomt hij uit om een totaalplaatje te geven van.. En dan weet je dat het dus heel bijzonder is dat al treinverkeer soepel langs Utrecht gaat de hele dag. Dus daar zit echt een opbouw in waarbij die data echt gemanipuleerd is om je verhaal te vertellen. En het is in mijn optiek ook heel goed gelukt. Hij onthult echt in plaats van dat je in een keer ziet: pats boem, hier zie je 24 uur.. Wat wel je eerste neiging is.

181

NERD MET VIJF POTEN

MASTERSCRIPTIE JAN KRUIDHOF

Er is online een Noorse visualisatie van verhuisbewegingen. En die toont dan ook hele toffe lijntjes vanuit Oslo naar buiten en van buitenaf naar Oslo en dat toont dus aan dat mensen vanuit Oslo verhuizen en naar Oslo verhuizen. En die camera springt gewoon wat rond en springt dan naar een volgende stad en daar gaan ook mensen in en uit en het ziet er heel gaaf uit en dat ding is ook veel rondgestuurd. Maar als je daar kritisch naar gaat kijken dan denk je: Ja goh, dus mensen verhuizen naar Oslo en eruit. Ja, boeiend. Er zit eigenlijk helemaal geen verhaal in en er is helemaal niet nagedacht over hoe de camera gaat. En dat is iets waar wij heel veel over nagedacht hebben. Hoe dun ook, al is het alleen maar om aan te tonen dat er wegen voor de haven liggen, er moet een verhaal in zitten en je denkt na over camera, timing en hoe je wat jij vertelt staaft met de data. En dat is echt wel een principe waar we heel scherp op zijn geweest en wat, denk ik, ook heel sterk uit die animaties komt. En die onderwerpen. Allereerst de onderwerpen van de afleveringen. Op basis waarvan heb je die gekozen? Je zei al dat je een beetje dramatiek in de data brengt. Zijn onderwerpen als gevaar daarom ook gekozen? We wilden natuurlijk de werking van Nederland laten zien. Dus dan ga je na: wat heb je allemaal in Nederland? Daar is inderdaad met name dan meer vanuit tv iets meer op dramatiek gericht. Dus daar komt dan: we moeten ook iets met gevaar. Dan ga je over Nederland nadenken en denk je: we moeten iets met water. Dus dan komt die animatie erin. Dus dan komt dat onderwerp op de kaart. Dus dat ontstaat ook gewoon om te proberen een soort geheel beeld van de werking van Nederland te geven. Dus dan kom je snel bij natuur, dan kom je bij water en dan is veiligheid daar ook een onderdeel van. Die onderwerpen hebben gedurende het proces nog wel heel veel veranderd. Dus daar zaten we zelf ook nog wel mee te hannesen. Op een gegeven moment was er zelfs sprake om de boel om te gooien en toen heb ik gezegd: Dat kan niet, want we zijn al zover met de website, met grote datasets te verzamelen, dat kunnen we niet opeens veranderen. Eerst zou boeren veel meer een aflevering alleen maar over boeren worden. Dat is een aflevering over knutselen geworden, om het wat anders te maken en online gaat dat nog wel veel meer over boeren. Het aantal koeien per vierkante kilometer. Waar boeren meer doen dan alleen boeren, dus dat je er ook kan logeren of melk kan kopen. En de grootte van boerenbedrijven. Het idee was dat je dan op zoek kan gaan waar nog een pittoresk boerenlandschap te vinden is. Waar je ook kan logeren en met veel koeien. Want koeienlucht is een fijne boerenlucht en varkenslucht is vies. Dat stinkt. In Brabant stinkt het daarom ook veel meer, want daar zitten varkens. Maar met die onderwerpen.. We hadden in ons hoofd een beetje: we doen twee animaties per aflevering. En dat is eigenlijk na verloop van tijd geweest dat

182

NERD MET VIJF POTEN

MASTERSCRIPTIE JAN KRUIDHOF

we ook heel erg gaan zoeken. Die GPS-animaties die werken het beste, daar zit beweging in. Met wandelaars, met mensen die.. We gingen op een gegeven moment ook veel meer naar animaties als de ontwikkeling van natuurgebieden. Die lenen zich eigenlijk veel minder goed voor een echt vernieuwend, verrassend beeld. Omdat je dan veel sneller in een soort aardrijkskundigeachtige uitleg terecht komt. Dus daar hebben we op een gegeven moment wel gezorgd: per aflevering moet er minimaal n zon GPS-gebaseerde animatie zijn. Omdat die zich ook veel meer leent.. Want daar gingen we natuurlijk ook naar op zoek: hoe vertaalt zich dat nu naar tv, die data? En dan ontdek je: als die beweging er al in zit door GPS dat beweegt, dat is een puntje, dat kan ergens naartoe, die kun je met een camera gaan volgen dan gebeurt er iets in beeld. Dan moet je er nog een verhaal bij bedenken. Maar dat werkt al beter dan aantonen dat er in het noorden grasland is. Dat is gewoon land groen inkleuren. Dan gebeurt er niet zoveel. In die zin waren er ook wel pragmatische redenen om te zoeken. Zo ben ik op een gegeven moment bij natuur gaan denken: we moeten nog iets met dieren daarin doen. Ik wil getrackte dieren daarin doen. Zeehonden waren niet gelukt, die hadden we niet, daar konden we de GPS-tracks niet van krijgen. Ik weet niet meer precies wat daarmee was, maar op een of andere manier lukte het niet om dat binnen te krijgen. Volgens mij worden ze wel getrackt. Of geteld. Maar anyway, toen ging ik kijken: wat is er dan? En toen stuitte ik per ongeluk op een onderzoek dat herten gevolgd werden met hele grote GPS-batterijen en daar gaan zoeken en dat is een hele leuke animatie geworden. En dat was ook grappig, want dat onderzoek was net begonnen, dus het was voor hun ook voor het eerst dat ze resultaten zagen. En hoe ging die samenwerking met verschillende mensen? Ik las dat je ontzettend veel data kon krijgen. Maar je hoort weleens van datajournalisten die dingen willen onthullen, dat ze moeten wobben en scrapen. Zijn jullie daar ook mee bezig geweest? Nee, scrapen was gewoon niet nodig. We hebben een paar.. Vooraf hadden we gezegd: we willen geen dynamische data, het is statische data. Puur omdat dynamische data verandert en je moet er een beeld van schetsen. Van de site kwam wel vaak de vraag: gaan we wat met de actuele data doen? Dat leek veel te risicovol. Voor de website hebben we het gewoon nooit nodig gehad om te wobben. Het was wel dat we bepaalde GPS-gegevens van politievoertuigen, die in de aflevering Veiligheid hadden, die kregen we eerst niet. Die kregen we pas toen we al twee afleveringen hadden uitgezonden. En toen had de politie zoiets van.. We hadden dat contact al wel, maar tijdens de eerste afleveringen hebben we die data gekregen en een verhaal verzonnen en de animatie nog gemaakt. Dat was echt een last minute klus.

183

NERD MET VIJF POTEN

MASTERSCRIPTIE JAN KRUIDHOF

Hadden jullie toen al wat anders voorbereid? Dat hebben we afgeschoten. Er zijn ook een X aantal animaties in het proces nog afgeschoten omdat ze gewoon niet goed waren of niet goed het verhaal vertelden. Ik dacht dat jullie bij aflevering 1 de hele serie al af hadden, omdat het zulk intensief werk is Dat hoopten we ja, haha. Nee, er zijn echt animaties op maandagavond nog de montagekamer in gegaan om voor dinsdag net op tijd.. Eentje zelfs die ik nog niet eens gezien had, wel versie n, maar er maar op vertrouwd heb. Aerodata, dat zijn al die meetvliegtuigen die over heel Nederland gaan. En daar is het verhaal ook niet al te sterk geworden, daar had nog een slag overheen gemoeten. Maar het zag er wel heel spectaculair uit. Maar zo zijn er nog wel een paar geweest. Maar dat was ook omdat het knutselland was en niet boeren meer, dus moest het iets anders worden. De moeilijkste data om te krijgen was.. Informatie over wat er onder de grond zit, dat is gewoon heel slecht vastgelegd. Mensen wilden wel meewerken, maar het was er gewoon niet. Of we konden het niet krijgen in een formaat dat bruikbaar was voor ons. Hetzelfde geld voor Brinks, van waardetransport. Die wilden hun data met plezier met ons delen, wat mij hogelijk verbaasde, alleen ze wisten zelf niet hoe ze het uit hun tool moesten krijgen. Ze hadden het in hun browseromgeving in een tool en ze gebruikten dat op het n te bekijken. Ze konden me een bitmap geven met een dikke viltstipstreep erop, maar daar had ik niets aan. Het was gewoon niet te traceren waar die data te halen was, dus dat hield gewoon op. Gewoon in Internet Explorer. Daar konden ze dat wel opvragen, dan zagen ze op een schermpje waar die autos rijden. Alleen wij moesten natuurlijk het archief hebben van eerdere ritten. En ze wisten gewoon niet hoe ze dat moesten archiveren of waar dat in het systeem ging. En we konden daar niet in en konden het bedrijfje niet snel genoeg traceren die die tool had gemaakt en daar mochten we eigenlijk geen contact mee. Dus ze wilden wel, maar het lukte technisch niet. En het andere ding wat ons, gaande het proces, het meeste werk opleverde was dat wij een publieke omroep zijn, dus wij mogen geen dingen van waarde aannemen en dat het Commissariaat van de Media gaandeweg het proces dacht: Ja, maar die dataset die jullie hebben, dat vertegenwoordigt een waarde. En daar hebben we een heel gesprek met hun over gehad waarbij wij zeiden: Als je een directeur van een bedrijf een lezing laat geven, kost dat geld, maar als je hem als VPRO interviewt is het gratis. Een dataset kan wel geld kosten, maar wij raadplegen, wij interviewen de data. Dus wij waren het er ook principieel niet mee eens. Maar om aan de safe side te zitten hebben we wel overeenkomsten moeten sluiten met die partijen, waarbij ze in ieder geval afstand doen en erkennen dat ze die data.. Dat was nog een

184

NERD MET VIJF POTEN

MASTERSCRIPTIE JAN KRUIDHOF

heel juridisch traject erbij. Dus we hebben niet hoeven wobben, maar daarin hebben we nog wel een heleboel papierwerk te verstouwen gehad, wat nog even een projectje binnen het project werd. Wat betekent dit dan voor de toekomst van datajournalistiek bij de publieke omroep? Nou, dat de VPRO daar in ieder geval een eerste horde genomen heeft. We hebben ook gesproken met het Commissariaat van de Media en die gaven uiteindelijk wel toe, maar gezien de tijdsdruk konden ze daar nu niet nog een uitzondering op maken en dan scharen ze zich sneller aan de conservatieve kant. Maar als je kijkt hoe duur sommige sprekers van Speakers Academy zijn, terwijl die ook gratis interviews geven.. ..dat is precies onze redenatie. Maar het was bijvoorbeeld wel dat Tomtom.. Die wilden hun data niet met ons delen, want die zeiden: Tien jaar oude data is nog steeds een paar ton waard en we gaan dat niet aan jullie geven. Vodafone deelde hun gegevens wel met ons, wat natuurlijk ook uiterst kritische data is, niet alleen qua waarde maar ook privacygevoelig. Dus dat was ook onder strikte voorwaarden dat we het daarna zouden vernietigen, dat we het niet zouden delen, dat we het alleen hier voor deze doeleinden zouden gebruiken. Dus je komt dan wel in onderhandeling met die partijen, maar ik denk nog steeds dat het niet anders is dan normaal journalistieke werk. Ook als je binnen een bedrijf.. Je kan het breekijzer gebruiken of listig afspreken in een kroeg of je bellen en overleggen met een bedrijf op en kijkt wat je er dan uit krijgt. Dus in die zin is het wel weer echt datajournalistiek? Ja. Je doet gewoon research en bent bezig hoe dan ook die data boven water te krijgen en wij hadden dan het voordeel dat het op een vrij positieve manier was, omdat wij er iets moois van maakten wat die bedrijven zelf ook wel konden waarderen, dat we dat met hun data deden. Dan zou je kunnen zeggen: Maak je je niet te afhankelijk van zon bedrijf? Nou, ik denk van niet. Wij hadden onze verhaallijn en wisten naar welke data we op zoek waren. Dat is het vertrekpunt geweest waar vanuit we naar instanties zijn gegaan. Er heeft nooit een bedrijf gezegd: We willen wel data geven, maar dan willen we er wel iets voor terug? Dat hebben ze misschien wel gezegd, maar dat hebben we.. We hebben niet eens de tijd gehad om er meer mee te kunnen doen. Er zijn alleen wel bepaalde dingen.. De politie Haaglanden had

185

NERD MET VIJF POTEN

MASTERSCRIPTIE JAN KRUIDHOF

de positie van hun autos vrij gegeven en die zeiden: Je mag niet te ver inzoomen op waar die autos rijden, want dat soort gegevens zijn vertrouwelijk. En Vodafone kon niet de activiteit per beller vrijgeven. Dat mogen ze niet eens, alleen per zendmast. En wij hebben dat weer terugvertaald naar zoveel mogelijk kleine gebiedjes waar die activiteit is. Omdat je anders alleen maar heel Eindhoven ziet oplichten of niet en wij wilden het natuurlijk bijvoorbeeld per wijk doen. Maar dat zijn wel logische beperkingen. Wat ik achteraf de grootste uitdaging vond.. Je krijgt activiteit per zendmast, bijvoorbeeld van Vodafone, laat ik dat voorbeeld aanhouden. Dus dan heb je een dataset en daar staan op een gegeven moment getallen in. En die getallen zeggen: Het was dan en dan, daar en daar heel erg actief. Ik heb geen mogelijkheid natuurlijk om te checken.. We hebben wel een redacteur aangenomen met expertise van geografische data, dus die kon in zoverre controleren: is dit een valide dataset, ziet dit er goed uit? Die kon daar ook echt bewerkingen in doen. Maar er is geen enkele methode.. Je moet wel geloven dat die data die zij jou leveren, dat dit werkelijke data is. Daar houdt het wel ergens op. En daar kan je nog wel een soort check op doen dat je gaat kijken: lijkt dit ongeveer te kloppen? En dan zie je bij die telefoondata dat die steden het eerste oplichten en dat daar de meeste activiteit is, dus dan denk je: dat is vrij logisch. Maar ja, dat is wel.. Waar kun je dan nog checken.. Heb je weleens getwijfeld? Nou, nee. Die met die telefoondata was wat dat betreft wel de pittigste, want dan moet je gaan kiezen hoe je dat visualiseert. En dan denk je: We gaan dat laten oplichten, als oplichtende wolkjes, maar hoe hard laat je iets oplichten en hoe donker maak je iets waar het minder actief is en hoe ver kan je daarin gaan? Voordat sommige regios opeens overkomen als donkere, Middeleeuwse gebieden. Ja, zwarte vlekken. Bij Amsterdam, bij Koninginnedag.. Wij wilden heel graag laten zien dat er nog een laatste piek rond Amsterdam Centraal Station was, waar mensen de laatste trein naar huis namen. En we wisten ook dat die er was en we wisten ook dat die inderdaad daar te zien was, alleen hij kwam er visueel niet zo sterk uit. Hoever kan je dan gaan? Je kan ook gewoon het Centraal Station wat harder op laten lichten en vertellen dat mensen daar de laatste trein.. Maar dat was nou precies niet wat we wilden doen. We wilden dat aan de hand van de data doen en daar zijn we wel zo strikt mogelijk in geweest, van: je moet de data visualiseren, anders kun je gewoon een mooie animatie maken. En als je dat gaat doen, ga je nat. Dus dat was wel echt onze strijd in de redactie. Tv die dan zegt: Ik zie het niet scherp genoeg, kun je niet gewoon wat

186

NERD MET VIJF POTEN

MASTERSCRIPTIE JAN KRUIDHOF

oplichten? Nou nee, dat moet wel binnen de verantwoorde grenzen die je bedacht hebt. Het moet nog wel ergens op slaan. En als het zon abstracte data wordt.. Het is activiteit per zendmast, dat is al niet te bedenken, dat ga je terugvertalen naar kleine gebiedjes, waarvan je weet.. Die zendmast heeft drie antennes, die antennes staan in een richting, dus je kan het delen door drie. Dan ga je een furanoid tekenen, wat een vlak is. Daar kan je dan een bepaalde activiteit aan toewijzen. Zo maak je een soort honingraat van Amsterdam en dat ga je op een gegeven moment inkleuren. Ja, dan ben je al zo abstract en theoretisch bezig dat je denkt: wat maakt het nog uit al ik het dan wat meer oplicht? Dus dat is je spanningsveld. Dan moet je streng zijn voor jezelf. Je wil de data visualiseren, dat is wat je aan het doen bent. En anders ben je een animatie aan het maken. Wat was jouw ervaring met datajournalistiek? Je werkt nu bij Digitaal, maar was je altijd al een whizzkid? Nee, ik ben projectleider bij Digitaal. Ik heb een journalistieke achtergrond en mijn rol is ook veel meer het verhaal en de camera in de gaten houden. De datajournalist was Frederik [Ruys] en die had kennis van geografische data en die kon die vertaling doen van zendmastactiviteit naar een furanoid en dat soort ingewikkelde dingen waar ik niks van af weet. Maar ik heb genoeg ervaring in het samenwerken met techneuten om de goede vragen te kunnen stellen en de inschatting te kunnen maken van: dit kan wel, dit kan niet. Maar ik heb daar wel een aansturende, cordinerende rol in gehad. En wat was voor jou zelf de eerste keer dat je met datajournalistiek in aanraking kwam? Dat is denk ik Nederland van Boven geweest. Maar dat je het alleen zag, zonder dat je er zelf aan meewerkte? Pfoe, ik heb echt het idee dat ik pas daarna.. Ja, ik ben me er echt rondom dit project in gaan verdiepen. Ik kan niet zo een, twee, drie iets herinneren van voor die tijd. Het enige wat ik nog weet is dat boekje van Freakonimics, dat ik graag aanhaal omdat daar zo briljant in zit dat je de goede vragen aan data moet stellen om verrassende conclusies te krijgen. En ik ben wat dat betreft toch iemand eigenlijk, stiekem, van het geschreven woord. Dus zon boek vind ik toch wel heel prettig. Dus nee, ik kan nu wel een heleboel dingen noemen die ik recentelijk heb ontdekt, die ik ook fantastisch vind, maar van voor die tijd.. Ongetwijfeld heb ik wel wat gezien.

187

NERD MET VIJF POTEN

MASTERSCRIPTIE JAN KRUIDHOF

Maar je volgde The Guardian bijvoorbeeld niet al jarenlang? Nee. In aanloop naar dit project heb ik wel een presentatie gezien van Aaron Koblin, die is inmiddels hoofd creative arts team in Google [Creative Director van het Data Arts Team van Google]. Die heeft onder andere ook die clip van The Arcade Fire gemaakt, waar Google Maps in wordt gebruikt, met [Chris] Milk samen. Die is fantastisch. En hij heeft de Johnny Cash clip, die is fantastisch.. En hij heeft onder andere ook het sms-verkeer van Amsterdam rond nieuwjaarsnacht geanalyseerd en in een visualisatie weergegeven. Die zag er fantastisch uit. En hij heeft ook de vliegbewegingen van Amerika gevisualiseerd. Dat waren wel wat dingen die wel inspirerend zijn geweest, ook voor dit project. Hoe groot was jullie team eigenlijk? Twee a drie man redactie, daar zijn een paar wisselingen in geweest. Een echte datajournalist, Frederik Ruys. En ik als eindredacteur en Geert [Rozinga] eindredacteur tv. En een producer en dan heb je de losse ploegen voor tv en camera en editing enzo. En die redacteuren, hadden die iets met data? Nee, Frederik en ik hebben dit behoorlijk samen gedaan. Wel in afstemming met Geert natuurlijk en die aansluiting met tv zoeken en Geert kwam er steeds meer in. Maar in principe hebben wij het leeuwendeel met zijn tweeen gedaan. Maar je moet niet vergeten dat we natuurlijk wel samenwerkten met 422 South in Bristol, die dat natuurlijk wel al voor Engeland en Duitsland hadden gedaan. Dus daar zat ook nog een hele ploeg mensen met een art director, een producer, twee graphic jongens en ook nog een programmeur. Dus daar is ook heel veel werk verricht. En daar zat een oude BBC-techneut die vroeger zelf nog de radio aanslingerde met een draaiorgel. Die schreef nu zelf eigen JAVA-scriptjes om al die data weer te vertalen naar n vorm. Je moet rekenen, dat bootverkeer, je denkt: dat is gewoon simpel, dat zijn posities. Maar nu heb je ook de tijd en de datum daarin, want je wilt weten op welke dag, hoe laat was die boot op een plek. Nu zijn er voor elk van die drie elementen ongeveer tien verschillende notaties te verzinnen. Voor datum heb je de Nederlandse notatie, de Engelse notatie en nog andere notaties. Voor tijd heb je 24-uursnotatie, A.M., P.M. en voor locatie heb je diverse projecties waarbinnen je net een ander coordinatenstelsel hebt. Zij krijgen al dat soort verschillende datasets binnen, maar moeten dan in n systeem gaan barsen. Zij moeten daar eerst een gigantische berekenslag op doen om alles n te maken. Je kunt je voorstellen dat daar ook nog weer een hele grote kans op fouten in zit. Een missertje in je berekeningsscript en je hele beeld

188

NERD MET VIJF POTEN

MASTERSCRIPTIE JAN KRUIDHOF

wordt anders en je bootjes varen niet meer door de zee, maar varen in eens in Duitsland door het land. En dat hebben we meegemaakt. Dus dat soort dingen kom je ook ineens tegen. Dat deden zij dus vooral? Jullie zaten niet met een rekenmachine in de hand? Nou, Frederik prepareerde die data wel voor ze. We probeerden dat wel zo goed mogelijk aan te leveren. En daar kregen we natuurlijk wel wat op terug en dan moesten we checken: klopt dit nog steeds? Hoe zag dat er precies uit? Jullie bereiden iets voor, zij gaven aan wat ze nodig hadden.. Stel dat je die botendata van kop tot staart neemt. De redactie verzint: we gaan een aflevering over Rotterdam doen. Wij gaan bedenken wat we dan willen vertellen over Rotterdam. We hebben iets gehoord over een rotonde in de haven. Op basis daarvan data opgevraagd bij havenbedrijf Rotterdam. Die data komt dan op een harde schijf binnen. Dan gaan Frederik en ik zoeken: kunnen we in die data inderdaad zelf vinden dat er een rotonde lijkt te zijn voor de haven van Rotterdam? Nou, die lijkt er dan ongeveer te zijn. Dan gaat hij met een briefing naar dat Engelse bedrijf toe. Dus dan schrijf ik: Het komt in deze aflevering, het komt ongeveer in die plek met die video eromheen, we willen ongeveer zon lengte en we hebben deze shots in gedachten van een boot die helemaal de haven ingaat en dat we aan de hand daarvan laten zien dat er een rotonde is. Dus het verhaal beschrijven. We krijgen een eerste ruwe versie van hun, nog zonder enige vorm van camera of wat ook, die puur laat zien hoe die data loopt op een dag. Dus dat is een hele ruwe visualisatie. En dan ga je in stappen daar vormgeving aan toevoegen, je timing veranderen en je camera aan toevoegen. Tot je uiteindelijk langzaam in vier, vijf iteraties naar een eindanimatie gaat. En die moet dan nog naar de editset om in het programma verwerkt te worden. Dat lijkt me wel vet, dat je iets langzaam ziet ontwikkelen, van ruw.. Nou, toen ik de eerste animatie ook af zag en dit was deze en hier zijn we ook heel lang mee bezig geweest, omdat we hier alles moesten uitvinden.. Dit was de tweede aflevering, Rotterdam, maar deze animatie waren we heel vlot mee bezig. In eerste presentatie gebruikte ik deze ook, deze heb ik bijna ook altijd wel in presentaties gehad, omdat ik dit verhaaltje als eerste rond had. Maar als je dat voor het eerst echt af ziet, dat is wel echt geweldig. En als je hem dan op tv tussen de rest in gemonteerd ziet en hij heeft muziek erachter en de voice-over er overheen, dat is nog geweldiger. Dat is wel kicken. Jij weet dat dat ooit en zeker bij deze, want hier heb ik bij Frederik ook naast gezeten op zijn zolderkamertje, dat we acht uur bezig zijn geweest om alleen

189

NERD MET VIJF POTEN

MASTERSCRIPTIE JAN KRUIDHOF

maar lullig te kijken of er nu een rotonde was te zien en welk bootje is nu een goed bootje om als voorbeeld te nemen dan weet je wel ongeveer waar het vandaan is gekomen en dan kijk je wel anders. Want wie had bij de VPRO nu eigenlijk als eerste bedacht: Dit moeten we gaan doen? Erik van Heeswijk, hoofdredacteur digitaal, die tennist met iemand die heel veel van geografische data weet. En zijn tennispartner had een programma in Engeland gezien dat heette Brittain from above en die zei tegen Erik: Daar moeten jullie ook iets mee doen bij de VPRO. En hij is dat hier toen gaan pitchen en dat is opgepikt en toen is gezegd: Wij gaan daar een project van maken. En hoe ben jij erbij gekomen? Geert was toen vanuit tv ingeschakeld en Erik had mij naar voren geschoven als eindredacteur vanuit digitaal. Dat was ook voor het eerst. Normaal krijgt digitaal dan achteraf te horen: Ohja, we willen hier ook een leuke website bij en Erik heef gezegd: Nee, we moeten crossmediaal werken, we moeten over onze mediagrenzen heen stappen. En vandaar dat ik daar ook als eindredacteur in zat om ook volwaardig mee te kunnen praten. En dan kun je dus dit soort wisselwerkingen tussen digitale informatie en tv-beelden krijgen. Dat heeft in die zin denk ik heel goed uitgepakt. Ben je, afgezien van het tv-programma, organisatorisch ook tevreden? Het kan altijd beter. In een nieuw programma moet je wel elk wiel uitvinden. Naast dit hebben we ook de website nog gemaakt, waar mensen zelf met de data aan de slag konden. Dat was zo mogelijk nog ingewikkelder. Daar wordt nu ook wel kritisch naar gekeken. Dat mensen moeilijk kunnen zien, dat hoeft natuurlijk ook niet, wat er verder achter zit. Wat was de kritiek dan? Ik hoor van andere datajournalisten juist vaak kritiek op te ingewikkelde webtoepassingen en vond jullie site juist mooi overzichtelijk. Nou, dank je, dat is fijn om te horen, dat is juist wat we voor ogen hebben gehad. Laten we het zo simpel mogelijk houden. En dan zie je dat dit toch moeilijk is. Persoonlijk had ik het leuk gevonden om allerlei dingen te checken, maar dit is ook voor bijvoorbeeld wat oudere mensen overzichtelijk.

190

NERD MET VIJF POTEN

MASTERSCRIPTIE JAN KRUIDHOF

Dat hebben we inderdaad heel erg geprobeerd in de gaten te houden, dus dat is prettig om te horen. Om inderdaad die simpelheid voor ogen te houden. Maar drie sliders; wanneer je een slider verschuift veranderd er direct iets; weinig laadtijd. De moeite, dat begrijp ik wel, is de interpretatie ervan. We gingen drie datasets met elkaar combineren op die website. Bijvoorbeeld het aantal koeien, grootte van boerderijen en wat je kan bij zon boerderij. Iedere dataset op zich is al best wel pittig. Het aantal koeien per vierkante kilometer ja, daar moet je wel een voorstelling van maken. Hoe doe je dat dan? Ok, je hebt naar boerenbedrijven gekeken en hoeveel koeien er bij zon boerenbedrijf is en waar die zit. Die combinatie: wat heb ik dan? Dan heb ik een gebied waarin n boerderijen zitten met veel koeien n die boerderijen zijn groot van omvang qua omzet die ze draaien n ze doen er ook nog logeren bij. En wat betekent dat dan? Dat stuk interpretatie was voor veel mensen toch moeilijk. En wat ik ook wel heb gemerkt is dat mensen soms de kleuren door elkaar haalden. De achtergrond was blauw en de data was oranje. Dat mensen dan niet snapten wat dan het actieve gebied was. Dan zie je toch.. Het is supermoeilijk om zon online kaart te maken. We hebben superveel geleerd en ik ben er heel trots op, dat het ook gelukt is. Er zitten datasets in die nog nooit eerder zo publiekelijk voor mensen toegankelijk waren. Huizenprijzen, omvang van tuinen bestond niet. Die heeft het kadaster speciaal voor ons uitgerekend. Er zitten unieke datasets in die eerder niet bestonden, maar er moet wel een vervolg op komen. Die kennis moet verder benut worden. Gaan jullie ermee verder? Dat is nu een beetje het jammerlijke. Dat een netmanager van tv, Nederland 1, daar nu over oordeelt, die niet zoveel verder komt dan: Een weblog van Boer Zoekt Vrouw haalt meer bezoekers dus dat is beter. Ja, dat is een beetje de frustratie als je te ver voor de muziek vooruit loopt. Nu zijn er wat positieve voortekenen dat de erkenning wel vanuit andere hoek komt in de vorm van prijzen die we met die site aan het winnen zijn. Dus hopelijk geeft dat weer een nieuw verhaal, dat er toch een vervolg kan komen. En het programma zelf, krijgt dat sowieso een vervolg? Ja, er komt een tweede seizoen. Daar zit het digitale stuk dus minder zwaar in. Maar je moet je ook bedenken: die kennis vertaalt zich ook door dat ik nu in een project van datavisualisatie voor Why Poverty bezig ben en die conclusies die ik geleerd heb nog scherper toepas. Door inderdaad redacteuren aan te nemen die echt in de data naar interessante conclusies gaan zoeken. Dus meer dat journalistieke toe gaan passen. Dus veel meer met voorgebakken resultaten te komen en de bezoeker nog minder zelf te laten uitzoeken, omdat dat toch nog heel

191

NERD MET VIJF POTEN

MASTERSCRIPTIE JAN KRUIDHOF

moeilijk blijkt te zijn. En dat ik ook wel snap: veel bezoekers hebben ook andere dingen te doen dan heel veel data interpreteren en kijken wat dat dan is. Je moet het voorbakken en uitgezocht hebben en presenteren. Vind je dat jammer? Of is het de taak van een journalist om de data te duiden? Ik denk dat dat een ontwikkeling is waarvan we nu net aan het ontdekken zijn wat we daar dan mee moeten. En ik denk dat het wel goed ook is, dat je als journalist zelf in die data op zoek gaat naar interessante conclusies, dat dat wel deels onze taak is. Ik zou het andere kant juist ook heel leuk vinden als je tools biedt, waarmee je.. Wat bij die kaart toch de hoop was, dat mensen hun eigen omgeving heel erg gaan uitzoeken, want dat is altijd leuk, want daar woon jij zelf. En dat die weer ons zouden verrassen met: Nou, ik heb nu gewoon uitgevogeld dat er gewoon ontzettend veel koeien in Utrecht staan. Dat dat een beetje de wisselwerking zou worden. Dat is niet helemaal gelukt. Maar dat lijkt mij nog steeds wel iets moois om na te streven. Sargasso en Altijd Wat merkten ook dat het lastig is om medewerking te krijgen van je publiek. Je moet zorgen dat het voor hun een kleine handeling is, anders wordt het teveel voor ze. Zij wilden hulp vragen bij een item over bouwprojecten, maar dat mislukte ook. Voor bouwputten hebben wij dat ook overwogen. We hebben bij Nederland van Boven ook gekeken: kunnen we nog iets met publieksinteractie? Data laten aandragen? Dat hebben we eigenlijk gedaan bij een animatie waar we GPS-trackers hebben meegegeven aan boswandelaars. Maar wat we wel overwogen hadden is hijskranen op de foto zetten en opsturen met GPSlocatie. Dan krijg je een hijskranenkaart en kom je dus iets te weten over bouwputten. En eentje die ik nog steeds in mijn achterhoofd heb zitten ik moet alleen nog andere mensen ervan overtuigen is om openbare beveiligingscameras in beeld te gaan brengen. Dat heeft Sargasso toch gedaan? Een stukje. De ambitie is natuurlijk landelijk dekkend. Elke openbare camera in Nederland op de foto krijgen. In die zin heeft Nederland van Boven nu wel een beetje naam en faam om daar wat mee te doen. Als wij van die miljoen mensen duizend zover kunnen krijgen dat zij ieder dertig cameras op de foto zetten.. Wat je dan weer zou kunnen doen is het blikveld van die camera in beeld brengen, in overlappende cirkels op elkaar zetten en dan zie je dus precies welke stukjes Nederland nog niet gefilmd worden. Heb je dan nog problemen met de politie?

192

NERD MET VIJF POTEN

MASTERSCRIPTIE JAN KRUIDHOF

Dat zou kunnen. Ik vind het nog steeds een heel cool idee. Dan heb je wel inderdaad dat mensen alleen een fotootje nemen en zorgen dat ze hun GPS aan hebben en die metadata meesturen en hoeven verder niks te doen. Wij doen de rest, wij checken of er werkelijk een camera op die foto staat, waar die is genomen, of we hem al hebben, voegen hem toe en zo bouw je langzaam een database. Want dan maak je het simpel. Om die reden hebben we het ook niet gedaan. We waren nog niet begonnen, niemand kende ons nog. Dan krijg je misschien twintig meldingen binnen. Dat schiet niet op, daar hebben we niets aan. Daar kunnen we niet op inzetten. Die workflow: ging dat echt zoals jullie dat zelf hebben getekend? (Wijst op workflowtekening.) Ja, ik denk dat dat wel.. Zoals met die boten: dat zijn deze stappen ongeveer. Daar komt het wel op neer. In eerdere gesprekken merkte ik dat sommige datajournalisten al in het begin van het proces met simpele tools een eenvoudige visualisatie maken om trends te ontdekken. Dus eigenlijk je van stap 1 al naar visualiseren.. ..Nee, dat is wel de tweede stap: analyseren. Wat ik zei over die boten, dat we acht uur zaten te kijken: is dat patroon te zien? Dat is ook met dat soort vergelijkbare tools als.. Google had ook een mapping tool, maar die hebben ze toevallig tijdens ons project stopgezet. Dat is het nadeel van Google tools die gratis zijn: ze kunnen stoppen. Er waren een paar andere: ESRI heeft een tool waar we gebruik van hebben gemaakt. De precieze tools weet Frederik beter dan ik, maar hij had een paar tools om die data te plotten op een kaart om inderdaad zelfstandig eerst te kunnen zien: wat zijn de patronen? Dat hebben we met die websitedata heel uitvoerig gedaan, want voor die websitedata was het cruciaal dat die data landsdekkend is en dat er in Groningen ook iets gebeurd en dat er in Limburg ook iets gebeurd. Dat er niet alleen in de Randstad wat aan de hand is. Verder met de workflow: duren de verschillende fases even lang? Bij die meeuw was niet veel research nodig en geen visualisatie nodig, want die wisten we gewoon al wel. Die was vrij straight forward, terwijl bij die treindata ontzettend veel berekeningen zaten. Daar hebben we zelfs externe partijen bij gehad die meehielpen met rekenen. En dan is een visualisatie ook veel langduriger. Dus dat proces wisselt wel per omvang van de dataset. In complexiteit ook: vliegbewegingen, supermoeilijk. Dat is allemaal berekend. Dus dan heb je geen losse punten die een lijn vormen, maar dan bereken je het traject op basis van een aantal controlepunten. Dus dat is een grote berekende dataset.

193

NERD MET VIJF POTEN

MASTERSCRIPTIE JAN KRUIDHOF

Het is een beetje zoals wanneer je een afbeelding hebt. Je kunt een pixelafbeelding hebben en daar is iedere pixel werkelijk ingekleurd. Of je hebt vectorafbeeldingen en die tekenen de lijnen.. Zo heb je ook datasets die daadwerkelijk elke punt geven en je hebt meer vectordatasets die de controlepunten geven en dan moet je het stuk er tussenin zelf invullen. Dat zijn gewoon veel complexere datasets en die duren dus ook veel langer voordat je een eerste visualisatie te zien krijgt. De processing time wordt op een gegeven moment zelfs een issue. De computers daar in Engeland stonden gewoon nachten te stampen om n animatie eruit gepoept te krijgen. Je zei in een interview al dat je dacht dat we al wat verder waren op dat gebied. Er is zelfs processingkracht in India ingekocht om bij te processen. Tegen dat soort dingen loop je wel pas aan als je het probeert. Ik durf serieus te zeggen dat geen enkele partij in Nederland is die zoveel grote, complexe datasets in zo weinig tijd verhaspelt heeft en er iets van heeft gemaakt. Ik bedoel: twintig animaties, dertig datasets online, vijftig in een jaar tijd is echt giga. En wij kregen ook te horen: Waarom ga je dan naar een Engels bedrijf? Waarom blijf je niet in Nederland, wij kunnen dat toch ook wel maken? En wij hebben daar een avond voor georganiseerd in Pakhuis de Zwijger. Wij hebben gezegd: Kom maar op dan. Dan zeggen ook veel mensen: Die processingtijd, dat kunnen wij veel sneller. En dat is leuk, met een eerste versie, die eerste visualisatie aan het begin van het project. Ja, dat lukt wel, die kregen wij ook wel binnen een dag. Maar nu high res[olution] op 1040 pixels voor HDTV-uitzending. Met alle vormgeving eromheen en geen ruisje in het beeld en geen rastertje om de pixels heen. Christal clear. Dan heb je een ander verhaal. Dan staan je machines een paar nachten te pompen, want dit is gewoon hoogst mogelijke kwaliteit. Het moest ook naast die superhoogwaardige helikopterbeelden komen te staan. Dus het moest gewoon het best mogelijke van dit moment uitgerenderd worden. En dan doe je dat echt niet effe in een paar uur. Zeggen mensen dat ook eerlijk: Wij kunnen dit niet aan? Ik heb bij die mensen gewoon zelf de conclusie getrokken. Van: wat jij nu laat zien en wat jij zegt. En bij die Pakhuis de Zwijger-avond merkten we ook dat heel veel mensen daar wel tegen aanliepen. Van: Jeetje, dit was eigenlijk toch wel ingewikkelder of moeizamer dan we gedacht hadden. Soms wordt je ook wel weer verrast door iemand die er wel iets heel tofs mee doet of er iets anders van kan maken, maar over het algemeen was bij mij wel de conclusie: we hebben het behoorlijk goed ingeschat. En zon bedrijf dat het al een paar keer eerder heeft gedaan en ook voor de BBC heeft gedaan.. Als het echt veel sneller had gekund hadden ze het daar ook geweten.

194

NERD MET VIJF POTEN

MASTERSCRIPTIE JAN KRUIDHOF

Qua organisatie. Ik denk niet dat er iemand van een ander programma naar jullie toekwam met: Ik heb nog een leuk idee voor jullie, of wel? Nee, van andere redacties is er denk ik niet echt veel input. We hebben wel met Labyrint nog wat samen nagedacht, maar ik kan me niet echt herinneren dat daar echt iets heel concreets uit is gekomen. We hebben wel veel rondgelopen in die geosector. Daar hebben we ook heel vaak dit project gepresenteerd, als: Hier zijn we mee bezig, dit is ook een mogelijkheid voor jullie om te laten zien dat wat jullie doen heel bijzonder is en wat voor geografische data je hebt. Hoe heb je dat aangepakt? We hebben hier een heleboel mensen uitgenodigd in de Tuinzaal [vergaderruimte in VPROgebouw]. Van ministeries, bedrijven en topmensen. We moesten natuurlijk ook sponsorwerving nog doen, daar hadden we ze ook voor uitgenodigd. De financiering van de NPO die binnen was, was niet voldoende om alles te kunnen realiseren, dus we hebben ook nog zelf extra geld bij geworven. Dat mag, tot op zekere hoogte. Dus in die zin hebben we ook een X aantal keren op beurzen van geo ons gepresenteerd en dan komen er wel bedrijven op af, van: Je moet deze data gebruiken. Dat heeft niet altijd tot resultaat geleid, maar er komen ook bedrijven die zeggen: We hebben luchtfotos van Nederland vanuit 1930 en dat plakken wij aan elkaar tot een hele kaart van Nederland. En dan zie je Nederland in de oorlog met kraters in de grond. Daar hebben we nog niet eens wat mee kunnen doen, maar dat soort tips komen dan wel op je af. Dus vanuit het veld, vanuit de sector zeg maar, komen er wel veel tips en gaan mensen meedenken. En op een gegeven moment kwam na elke presentatie ook wel iemand op me af die zei: Weet je welke data je zou moeten visualiseren? Onze databak, die is mooi, die moet je eens bekijken! Jajaja, we zijn al vol en het is al heel druk. Maar de organisatie binnen de VPRO.. Nee, kan ik me niet iets concreet herinneren. We hebben bij de NPO wel aangevoerd: Het is innovatief. Met name voor de website hebben we ook nog uit een innovatiepot financiering geregeld. Die nu niet meer bestaat overigens, is ook allemaal wegbezuinigd. En dan ga je ook de markt op om dat nog eventueel aan te vullen. We konden natuurlijk gewoon een begroting maken: we willen zoveel dagen met een helikopter de lucht in. Die heli kost geld.. Was die niet knetterduur? Nou, knetterduur. Mensen vinden.. Ja, het kost geld. Het was een heli met een piloot met een camera onder de heli met een aparte cameraman die met een joystickje echt precies de goede

195

NERD MET VIJF POTEN

MASTERSCRIPTIE JAN KRUIDHOF

beelden schiet. Ja, dat zijn specialisten. Dus dat is superduur, dus dan heb je al een vette post. En als je zegt: We moeten toch echt wel twintig, dertig dagen vliegen, dan tikt dat al aan. Ik heb nog wel een puntje dat ik ook wel ontdekt heb tijdens het maken hiervan, wat heel.. Twee dingen eigenlijk, die ik wel belangrijk vind. Ten eerste, over de indeling van het team. Het valt me op dat je met datajournalistiek drie kwaliteiten nodig hebt, die alledrie moeten samenwerken. Je hebt een journalistiek iemand nodig om een verhaal in die data te kunnen zien. Of dat nu een vernieuwend verhaal is of puur visualiserend, maar iemand moet naar dat verhaal kijken. Je hebt een grafisch iemand nodig die echt naar de vormgeving kijkt: hoe ziet dit eruit, hoe representeren we die data? En je hebt een technisch iemand nodig die de data kan bewerken, die erin kan rekenen, die er iets mee kan doen. Dus die drie kwaliteiten heb je altijd nodig. Dat is in een tv-redactie bijvoorbeeld niet altijd bij elkaar en in een digitaalafdeling ook niet altijd bij elkaar. Soms moesten we die techniek ook echt bij een gespecialiseerd bedrijf halen om bijvoorbeeld echt die treinen over die spoorrails te krijgen, om die vliegbewegingen goed te krijgen. Dat grafische zat dan ten dele ook wel bij ons en ten dele ook bij Engeland, dus je haalt het overal wel een beetje vandaan. Maar je hebt wel die drie disciplines nodig om datajournalistiek, datavisualisatie te doen. Het andere punt waar we tegen aanliepen wanneer je hiermee aan de slag gaat, is.. Gemiddeld zijn journalisten bezig om in Word een verslag voor een tv-redactie te typen en hebben een telefoon nodig en een computer waar je Word kan doen. Ga je nu tekstbestanden opvragen die pure, kale tekst 144 MB groot zijn en je moet daar 24 van op een computer zetten en je wilt daar bewerkingen op doen, dan red je dat niet op een standaard kantoor-pc die hier in de omgeving staan. Dus je hebt gewoon apparatuur nodig die er niet is. Dus de datajournalist heeft de helft van de tijd maar thuis gewerkt of inderdaad bij die gespecialiseerde bedrijven gezeten om in hemelsnaam maar berhaupt die datasets te kunnen openen. Je moet je bedenken: sommige van die datasets zijn zo belachelijk ontiegelijk groot.. Alleen aan tekst.. Pure tekst, 144 MB is een uur bootverkeer. Alle boten die in een uur in de haven van Rotterdam varen. Je denkt: 144 MB, dat is niet zo groot. Maar in pure tekst, hoe krijg je dat vol..

196

NERD MET VIJF POTEN

MASTERSCRIPTIE JAN KRUIDHOF

Dat is giga. Ga je daar een bewerking op doen, dan ga je zoeken naar een bootje, dan staat die computer al gerust tien tot twintig minuten te ratelen om die vraag te beantwoorden. En dan blijkt dat je net de verkeerde vraag hebt gesteld. Dan ben je dus acht tot twaalf uur bezig. Werd je dan niet helemaal gek af en toe? Jaha. Dan merk je dus: we hebben techniek nodig, maar we hebben echt een databaseprogrammeur nodig die die gegevens in een database kan zetten. Kon Frederik dat ook? Nee, niet zo sterk. Hij is meer graficus van huis uit en hij snapt die geografische data heel goed. Waren we met economische data aan de slag gegaan, dan heb je iemand anders nodig. Dus per type data heb je ook weer een specialist nodig. Maar ook gewoon zoiets praktisch als apparatuur, daar kom je pas achter op het moment dat je ermee aan de slag gaat. Dan weet je dus: oke, zo moet ik ongeveer mijn organisatie in gaan richten wil ik serieus datajournalistiek gaan bedrijven. Dus wil je hier echt verder mee.. Ik werk bij digitaal, daar maken we websites. We hebben ook bij ICT-helpdesk afgesproken dat wij wel alle programmas mogen installeren die andere mensen niet mogen installeren. Simpelweg omdat we dat voor ons werk nodig hebben. Op zich, de machinerie die onze programmeurs hebben, daar zou je een heel eind mee moeten komen. Want die programmeurs zijn ook al gewend om in databases rond te neuzen. Maar die zijn al projecten aan het doen. Die zouden dat qua apparatuur en kennis moeten kunnen doen, maar zo iemand heb je ook voor datajournalistiek nodig, maar wel iemand die rechtstreeks met een journalist samenwerkt. En stel, iemand van een kleine nieuwsorganisatie komt naar je toe en zegt: Wij willen ook iets met datajournalistiek doen. Wat zou je hem dan adviseren? Het hangt er heel erg vanaf. Wil je eens, een keer iets maken? Dat is iets anders dan dat je datajournalistiek structureel een plek wilt geven of een project wil doen van de omvang van Nederland van Boven. Dus heel erg: wat heb je nodig? Doe je iets kleins eenmalig, dan zou ik zeggen: Huur het in bij een specialist. Dan hoef je het niet in je organisatie te halen. Wil je het in je organisatie voor langere tijd een plek geven, bedenk dan dat je dus niet alleen de goede mensen nodig hebt die heel erg moeilijk te vinden zijn. Totdat ik Frederik vond die n journalist was n graficus n geodata snapte, dat was een godswonder. Ik had hem ook voor iets heel anders uitgenodigd en geheel toevallig tijdens het gesprek kwamen we erachter, dat ik zei: Maar ik wil jou op mijn redactie hebben als datajournalist. Ik had net die dag de vacature

197

NERD MET VIJF POTEN

MASTERSCRIPTIE JAN KRUIDHOF

uitgeschreven en geheel los daarvan sprak ik hem, eigenlijk als potentieel iemand om de visualisaties te maken, te visualiseren. En toen gaandeweg het gesprek ontdekte ik: maar jij bent onze datajournalist. Die mensen vinden is supermoeilijk. Het is nog heel erg nieuw. Bedenk dat er gewoon heel veel experimentkosten bij komen kijken. Wees je daarvan bewust. Je zit ergens in een beginfase, dus je gaat fouten maken. En je gaat nog achteraf bedenken dat het zoveel duizend keer efficinter had gekund als je dat allemaal van tevoren had geweten. Dat is denk ik voorlopig nog onontkoombaar met datajournalistiek. Dus weet je van die risicos bewust. En dat het dus niet alleen die expertise vinden is, maar ook heel pragmatisch apparatuur is. En dat de kans op niet honderd procent slagen aanwezig is, dat je nog in een pioniersfase bezig bent. Dat je erachter kan komen: Jeetje, nu hebben we zo ons best gedaan om het simpel en begrijpelijk te houden en dan zijn er nog mensen die het niet snappen. En hoe dieper jijzelf in die data komt, hoe moeilijker het wordt om daar nog afstand van te nemen. Dus gebruikerstest.. Als ik een ding anders had gedaan bij die kaart en dat is altijd een issue is gebruikerstests. Sneller aan mensen laten zien die er gebruik van.. Die webkaarten. Ja. Ik denk dat die animaties maken, dat dit gewoon.. Niet om te willen pochen of arrogant te doen wij hebben het ook gewoon ingehuurd bij een Engels bedrijf maar ik denk toch dat, om het echt goed te doen, dat het niet veel clubs gegeven zal zijn in Nederland.. Omdat het wel een heel gespecialiseerd.. Het is niet onmogelijk, maar.. En het kost veel. Ze kunnen het wel, maar op een ander niveau denk ik. En ongetwijfeld is dat volgend jaar anders en over twee jaar nog weer heel anders. En afgezien van die afschrikverhalen is het primair: verhaal, verhaal, verhaal, verhaal. Wat wil je vertellen? Moet je dat met data doen of kun je dat ook in een andere vorm doen? Waarom gebruik je data? Wij hadden heel erg: als we het met de camera niet kunnen filmen, dan doen we dat met een datavisualisatie. Het begint bij het verhaal. Het grootste spanningsveld waar we ook tegen aan hebben gelopen is: data is kneedbaar. Als jij zegt: Ik wil in de data zien dat station Amsterdam s avonds heel fel oplicht, dan kun je die data altijd wel zo manipuleren dat dit eruit is te halen. Dus je moet naar die data luisteren. Je moet openstaan voor wat die data jou te vertellen heeft. Daarnaar durven kijken en dat verhaal durven vertellen. En tegelijkertijd met je wel een bepaalde bril opzetten, van: ik ga hiernaar op zoek, ik ga deze vragen stellen. En ik ga kijken of dat in die data zit. Je kan niet alleen maar je volledig overgeven aan de dataset en hopen dat daar iets uitkomt. Je zal een bepaalde bril op moeten zetten om daar in te duiken. Dus

198

NERD MET VIJF POTEN

MASTERSCRIPTIE JAN KRUIDHOF

het is een wisselwerking tussen jouw vooropgestelde vraag willen beantwoorden en voldoende open blijven om je te laten verrassen door wat er in die data zit. Heb je ook wel eens gehad dat je een database in handen kreeg en gewoon ging schudden, zonder dat je een bewuste vraag in gedachten had? Nou, we hadden wel een paar datasets waarvan we dachten: die zijn zo bijzonder, daar moeten we iets mee doen. Het kadaster gaf ons het BAG-bestand, met alle gegevens van alle gebouwen in heel Nederland. Met bouwjaar er bij in en vorm en positie. Dit is zo uniek, daar moeten we iets mee doen. Maar we wisten nog niet wat. Dat is uiteindelijk de groeianimatie van Utrecht geworden en een online kaart. Die [animatie] is heel erg versneden met helikopterbeelden, omdat we eigenlijk uiteindelijk de animatie iets te droog vonden. Dus hebben we daar toch helikopterbeelden doorheen gemonteerd. Wat heel mooi heeft uitgepakt, volgens mij. En hetzelfde geldt voor ProRail, met die treingegevens. Frederik had een contact bij ProRail, die wilde die gegevens leveren. Ja, dat is dan sterk argument om te denken: Daar gaan we iets mee doen. Vodafone idem dito: zij wilden meewerken, zij wilden hun telefoongegevens leveren. Dan verzinnen we wel iets wat we daarmee gaan doen, want dat zijn gewoon toffe gegevens om te pakken te krijgen. Het is niet zo dat jullie dachten: We willen het telefoonverkeer in kaart brengen, laten we contact zoeken met Vodafone? Nee. We dachten: we willen laten zien hoe Nederland wakker wordt. Dat idee hadden we al wel. En we hadden contact met Vodafone en toen hebben we die twee aan elkaar gepuzzeld van: He, dat kunnen we daarmee dan misschien aantonen. Want later hebben we diezelfde Vodafonegegevens ook ingezet in de Koninginnedaganimatie, om aan te tonen of grote groepen mensen de routes van de gemeenten volgden. Dat blijft ook met data: je kan meerdere verhalen met dezelfde dataset vertellen. Maar echt helemaal willekeurig in een dataset grasduinen. Het waren er wel veel, ik moet ook wel even graven: Wat hadden we ook alweer? Dimitri vertelde bijvoorbeeld dat hij bij het CBS de dataset zocht met de sufste titel, waarachter iets verscholen zou kunnen zitten, om die vervolgens eens beter te bekijken. Dat hebben wij denk ik niet gedaan. Wij hadden natuurlijk al zoveel bronnen om uit te putten. En we moesten wel bij die tv-aflevering blijven. Wat wel is.. Op een gegeven moment krijg je een bestand met alle gegevens van alle boeren in handen. Van Alterra. Ik weet even niet meer hoe

199

NERD MET VIJF POTEN

MASTERSCRIPTIE JAN KRUIDHOF

dat bestand heet, maar iets met agrarische informatie bladiebla. En dan zie je dus daar ook in staat of boeren kerstbomen verkopen of niet en hoeveel kippen ze op hun land hebben. Dan blijkt dat die boeren dat dus ieder jaar, wettelijk verplicht, helemaal moeten invullen. En daar hebben we bijvoorbeeld die kaart uitgehaald van welke boeren doen meer dan boeren alleen. Daar zou je potentieel zoveel meer uit kunnen halen. Je zei eerder ook dat daar iets in stond over opvolgers? Ja, of ze een opvolger hebben of niet. Ga potentieel nadenken: welke boerenbedrijven hebben geen opvolger, wat is hun land en waar staan bouwprojecten gepland voor de komende tijd? Ik denk dat je daar hele leuke conclusies uit kunt trekken. Als je dan bij projectmanagers hun projectplannen gaat halen en of dat toevallig op het land is van boerenbedrijven waar geen opvolger is. Die konden nog wel eens verkocht gaan worden. Zulke connecties moeten te maken zijn. Wij hebben natuurlijk de mazzel gehad dat we heel veel bestanden in handen kregen omdat mensen sympathie hadden voor ons project. En dan ben je natuurlijk wel zon journalist dat je ook naar die bestanden kijkt van: mmm, we kunnen hier natuurlijk ook hele andere dingen mee doen. Maar het gaat in goed vertrouwen. Off the record informatie moet je ook gewoon wel secuur mee omgaan, het is ook jouw reputatie. Je kunt er wel mee doen wat je wil, maar dan krijg je daarna nooit weer wat van ze. Dan heb je als media wel een ander belang dan de bronhouder en daarover moet je elkaar recht in de ogen kunnen kijken. Ik zou niet snel meer iets naar [bepaalde nieuwsorganisatie] sturen. Als ik zie wat die ervan maken.. Bij een grote organisatie wil een eindredacteur ook wel precies weten wat ze na twee weken onderzoek kan verwachten, hoorde ik. Hoe zit dat bij jullie? Dat is bij ons ook.. Wij hadden wel zoiets: er moeten elke aflevering wel twee animaties zijn die de moeite waard zijn om te kijken. Dus je kan wel degelijk een bepaalde productieis stellen. En dan ga je gewoon met een bepaalde bril op met die data aan de slag. Van een heleboel hebben we ook gezien: ja, daar konden we niets mee, want we hadden wel een deadline te halen. Je zei in een interview dat je in de toekomst nog wel meer bezig wilde met serieuze datajournalistiek. Zelf data opbouwen. Zijn er dingen die je in het tweede seizoen ook echt anders gaat doen dan in het eerste seizoen? Ik neem nu trouwens aan dat jij ermee bezig gaat. Is dat zo?

200

NERD MET VIJF POTEN

MASTERSCRIPTIE JAN KRUIDHOF

Nee, ik ben er wel deels bij betrokken hoor. En ik hou wel in de gaten en ik ben wel aan het meedenken hoe we een vernieuwingsslag kunnen maken. Nederland van Boven moet natuurlijk vooral gewoon visueel uitdagend blijven. Dus daar zitten we wel te kijken: goh, kunnen we datasets van Utrecht van 1800, daar zijn hele 3D-modellen van, zou je daar virtueel overheen kunnen vliegen met een virtuele helikopter? Zoiets zou een nieuwe vorm van datavisualisatie kunnen doen? In Groningen hebben ze dat gedaan, trouwens. Ja. En ik denk dat wij dat mooier kunnen. En dat we dat, als dat met een echte heli doen en met een virtuele.. Daar moet de VPRO het ook van hebben. Wij zijn heel goed in iets heel mooi in beeld brengen. Dus daar probeer ik toch wel over mee te denken. En wat ik nu in dat Why Poverty project heel scherp heb, na aanleiding van die websitelessen.. We moeten nog meer zelf al in die data wroeten. Nu met twee redacteuren die niets anders gaan doen dan op zoek naar de meest interessante conclusie uit die dataset halen. Dus dat is wel.. Misschien bedoelde ik dat wel met meer serieuze datajournalistiek. Het lijkt me wel heel spannend om uit zon dataset van boeren en boerenvolgers te kijken en daar een conclusie uit te halen die je niet zou verwachten, wat tot iets leidt. Maar ik weet niet of ik dat zlf heel erg ga doen. Waarom ga je er niet mee bezig dan? Nou, ik ga er wel mee bezig in die zin dat ik nu bezig ben met die Why Poverty-datavisualisatie, maar het werkelijke redactiewerk.. Ik ben meer coordinerend en hou het overzicht en probeer de lijnen uit te zetten. Dus ik ben er wel in die zin mee bezig, maar ik werk dan weer met redacteuren samen om het echte veldwerk te doen, zeg maar.

201

NERD MET VIJF POTEN

MASTERSCRIPTIE JAN KRUIDHOF

Erik Bloem (Altijd Wat) Allereerst: wat is jouw achtergrond? Ik ben eigenlijk na mijn studie bij de Volkskrant terecht gekomen als onderzoeker op het Top 200-project. Daarin probeerden we aan de hand van een database met functiegegevens een lijst samen te stellen van invloedrijke Nederlanders. Ik vulde de database en er was in beginsel een hoogleraar, later een onderzoeksinstituut in Wenen dat een netwerkanalyse uitvoerde. Zo ben ik bij de Volkskrant terecht gekomen. Uiteindelijk ben ik zelf ook wat datajournalistiek onderzoek gaan doen. Maar ook gewoon in zijn algemeenheid onderzoek. En omdat ik weet hoe een database werkt, heb ik toen gesolliciteerd bij Altijd Wat. Omdat veel journalisten, zoals je zult weten, niet weten hoe databases werken, omdat ze als alfas zijn opgeleid en die bedrevenheid met de computer sowieso wat minder hebben. Dus vandaar dat ik hier zit. Maar ik doe absoluut niet alleen datadingen. Laatst hebben we iets gedaan met moties en amendementen. Dat is ook wel meer gedaan, maar wij hadden andere gegevens. Wij hadden gegevens van de universiteit Leiden. Die hadden iedereen die bij die moties genoemd worden in kaart gebracht, terwijl de meeste sets alleen maar de eerste indiener noemen. Daar hebben we een graphic mee op internet gemaakt. Was dat die met de SP? Ja. En we hebben de Altijd Wat Wijzer, ken je die? Dat is mooi vehicel om data een beetje aantrekkelijk te presenteren. Hoe werkt dat precies samen met het programma? Het is aanvankelijk bedoeld om gewoon op zichzelf te staan. Je hebt vijf elementen in onze uitzending. Je hebt de Altijd Wat Wijzer, een gesprek, feit of fictie, een reportage en een column. Het is een van die onderdelen. Maar wij hebben twee maanden geleden een zorgverhaal gemaakt waar ik ook bij betrokken was en we wilden eigenlijk een beetje in kaart brengen hoe mensen nou aankijken tegen de kostenstijgingen in de zorg, wat de redenen daarvoor zijn. En daarvoor wilden we ook laten zien waar die kosten vandaan komen, hoe die kosten gestegen zijn, wat een gemiddeld gezin tegenwoordig uitgeeft aan zorg. Omdat dat allemaal droge materie is aan de ene kant allemaal sprekers, dat is niet hele aantrekkelijke televisie, en aan de andere kant die gegevens hebben we die Altijd Wat Wijzer gebruikt. Door hem op te knippen in vijf stukjes van 30 seconden, die loopt door de reportage heen. Dat hebben we bij de SP eigenlijk ook zo gedaan. Dat blijkt te werken. Op die manier kunnen we data aantrekkelijk maken.

202

NERD MET VIJF POTEN

MASTERSCRIPTIE JAN KRUIDHOF

Voor de site gebruik je dan dezelfde graphics? Nee. Met een jongen van internet design heb ik een poster ontworpen. Op een bepaalde manier ouderwets, maar het werkt wel. Het ziet er aantrekkelijk uit. Je kunt het makkelijk delen op Facebook, Twitter. En die jongen, is dat dan een jongen van jullie redactie? Nee. Hij is echt van internet en hij doet dus ook dingen voor radio en andere televisieprogrammas. En ik heb gewoon een verzoek ingediend bij Internet, of er iets mogelijk was. En ze vonden het een leuk idee. Ze zijn toen iemand gaan vrijmaken en die heeft daar een aantal dagen voor gekregen om daarmee bezig te gaan. Hij maakt dus geen deel uit van jullie redactie. Maar jullie zouden hem niet altijd nodig hebben en hij zou niet altijd tijd hebben? Nee, maar mijn functie is een nieuwe functie. Dus alles wat er gebeurt is ook een beetje nieuwig en de ervaring leert nu dat zij [de afdeling Internet] dat ook leuk vinden en dat ze daar ook positieve reacties op krijgen, dus ligt het in de lijn der verwachting dat dit vaker kan gaan gebeuren. Het is nu gewoon nog een beetje.. Pionieren. En als je het zou opdelen in percentages, hoeveel procent van je tijd ben je dan echt bezig met datajournalistiek, denk je? De eerste maanden was ik wel fulltime bezig met data-analyses. Dan is het ook nog een beetje zoeken, want ik wil wel even een zijstapje maken. Wat ik wel vind bij datajournalistiek is dat het heel vaak dingen oplevert waarvan je denkt: Ohja, dat wist ik eigenlijk al wel een beetje en nu is het in kaart gebracht. Maar goed, dat is niet echt het onderzoek dat ik wil bedrijven. Dat is bijna een wetenschappelijke discipline. Wat ik ook zie als ik de datablogs een beetje volg is dat.. Er komen niet hele schokkende dingen uit. Dus we zijn ben de zorgkosten toen bezig geweest. Ik heb allerlei ziekenhuiskosten opgevraagd. Die hebben allemaal voor elke zorgbehandeling een prijs. Er zijn per ziekenhuis 4300 zorgbehandelingen. Maar ja. Bij al die organisaties heb ik PDFjes opgevraagd, PDF omgezet naar Excel. Excel in een MySQL-database gestopt en op gegeven moment kun je dan van een

203

NERD MET VIJF POTEN

MASTERSCRIPTIE JAN KRUIDHOF

aantal behandelingen die veel uitgevoerd worden een overzicht maken waar die het duurst en het goedkoopste zijn. Daar hebben we ook een soort poster van op internet gemaakt. Dus toen ben ik heel veel met data bezig geweest, maar dat leverde naar mijn zin niet iets op waar we echt mee de buhne op konden, waar je echt iets mee ontdekt. Want je wilt wel graag hard nieuws? Ja, eigenlijk wil ik dat mensen Schande zeggen. Nu hoeft dat niet altijd, maar je wilt wel tegels lichten. En dat is lastig met datajournalistiek. En stel dat jij een ingewikkeld onderwerp mooi en helder in kaart brengt: zou dat niet geschikt zijn voor Altijd Wat? Dat kan. Mensen kunnen ook naar mij toe komen om te vragen: Kun jij dit een beetje helder in kaart brengen? Dan kunnen we dat gewoon doen. Maar niet dat je dat als uitgangspunt of doel neemt. Je wilt echt op zoek naar nieuws. We zijn nu bezig met een onderzoek, daar kan ik niet teveel over zeggen, maar dat gaat over duurzaamheid. En waarom dat in Nederland niet zo goed lukt. En dat is een beetje in kaart brengen hoe de lijnen lopen. Maar ook een beetje onderzoeksjournalistiek. Achtergrondgesprekken voeren. En door een paar tegels te lichten toch laten zien: Zo werkt het. Maar het is in grote mate toch een overzichtsverhaal. Bij NRC zeiden ze: Wij willen echt met nieuws komen. Jullie willen dat wel, maar.. Maar NRC is echt een krant. Ik heb ook wel met Arlen Poort.. Ik heb stage gelopen bij NRC Handelsblad en toen zat ik ook bij Arlen Poort. Die was toen heel druk met die verkiezingskaarten. Want hij heeft dat prachtig.. Met die stembureaus, dat je per stembureau de uitslag kan checken. Zij willen echt nieuws maken, ja. Daar worden ze ook om gekocht natuurlijk. Wat dat betreft hebben jullie iets meer ruimte. Ja, wij zijn een opinieprogramma. We vinden het leuk om nieuws te maken, maar we kunnen niet elke week nieuws maken en dat is niet ons streven. Maar we willen wel spraakmakende verhalen maken. We hebben het al een beetje gehad, maar: de doelstelling. Wat is, in een paar zinnen, jouw taak?

204

NERD MET VIJF POTEN

MASTERSCRIPTIE JAN KRUIDHOF

Mijn taak is om grotere verhalen voor te bereiden, eigenlijk. Grotere, ingewikkelde, verhalen voor te bereiden. En dat voorbereiden houdt dan in, dat je ook al mensen zoekt? Ja, ook gesprekken met mensen voeren. Mensen zoeken, gegevens erbij zoeken. En de data, wanneer komt dat aan bod? Het kan natuurlijk op allerlei manieren gebeuren. Er kan een verslaggever of redacteur naar mij toe komen, van: Kunnen we hier iets mee? En weet jij of hier ook data over te vinden zijn?. Gebeurt dat vaak trouwens, dat mensen naar jou toe komen? Ja. Verder kan het zijn dat je op iets stuit, doordat je een verhaal hoort van een vriend van je of dat je op internet nieuws aan het bekijken bent en denkt: He, hoe zou dat eigenlijk zitten? Dat kan. Verder hebben we hier ook.. Het heette de ideeenfabriek, maar het zijn twee mensen die een beetje innovatieve ideeen proberen op televisie te krijgen. En daar brainstormen we dan mee over bepaalde domeinen waarbinnen wij onderwerpen willen maken. En zo zijn we ook op die duurzaamheid gekomen. Dus zo kan dat gebeuren. Hebben jullie beats die jullie in de gaten houden? Bijvoorbeeld hoe het met de gezondheidszorg zit? Dat is een van de themas waarop wij hebben ingezet deze zomer, de gezondheidszorg. Daar hadden we al wat mee gedaan en daar zijn we nu mee verder gegaan. Dat is wel een van de domeinen waarin wij geinteresseerd zijn. Wij zijn een opinieprogramma en dat lijkt misschien in werkwijze op Zembla of Tegenlicht: je hebt geen verplichting op net als een krant het hele spectrum van het nieuws te.. Dus je kunt een jaar lang de ziekenhuiszorg theoretisch gezien helemaal links laten liggen en helemaal vergeten hoe het ook alweer zat en dat is een voordeel en een nadeel. Want als je je er dan in verdiept, dan besef je je dat je het al die tijd niet hebt bijgehouden, dus dat je heel veel mist en niet weet. En dat je daarin weer overnieuw moet beginnen. In die is een datajournalist zo zie ik mijzelf dus niet echt, als datajournalist dus generalist. Die moet dus elke keer weer zich verdiepen in het onderwerp waar hij mee bezig is om te begrijpen welke data relevant zijn, wat die kunnen betekenen enzovoorts.

205

NERD MET VIJF POTEN

MASTERSCRIPTIE JAN KRUIDHOF

Vind je dat leuk of juist een belemmering? Dat voelt wel op een bepaalde manier als een belemmering. Het maakt het werk wel leuk. Het maakt het werk heel afwisselend. Maar ik was hiervoor dus economiejournalist bij de Volkskrant. En dan heb je gewoon je portefeuille en dan hou je bij wat er in portefeuille gebeurt. En dan kan je op het moment dat er iets is waarmee je de diepte in kan gaan.. Dan weet je daar heel erg veel van. Dus dat is anders. Ze zijn na mijn tijd een beetje bezig gegaan met de financiele huishouding van die woningcoorporaties, bijvoorbeeld. Ik zat daar toen ook een beetje in. Omdat je daar inhoudelijk heel erg mee bezig bent kun je er ook meer mee. En kun je er ook makkelijker nieuws mee maken. Krijg je hier nu wel de ruimte om ergens flink in te duiken? Ik krijg daar de tijd voor, ja. Ik ben eigenlijk aangenomen voor vier afleveringen per jaar. Als redacteur schuif ik dan aan. Maar dan schuift er tussendoor ook vast van alles tussen? Het is ook mijn eigen onrust. Omdat ik dus, zoals gezegd, van de Volkskrant kwam en daar werd elke dag natuurlijk een stukje verwacht. Nu zit je soms een week te broeden op iets en op een gegeven moment wil je dat kwijt. Wil je dat het iets is en dat je weer met iets anders verder kan. Welke invloed heeft dat verder, dat je van een krant komt? Merk je dat je een andere werkinstelling hebt? Hier is het toch meer een overheidsinstelling. Hoe bedoel je dat precies? Het is toch wat rustiger. Vooral de redacteuren zijn wat rustiger. Er zit wat minder druk achter. En de krant was echt hectiek. Elke dag de deadline. Heeft dat ook invloed op de uiteindelijke dingen die jullie maken? Dat die ook rustiger zijn? Dat is wat wij willen. Uiteindelijk willen wij afstand nemen van dat hijgerige en laten zien hoe het nou eigenlijk echt zit. En dat is wel leuk. Daarom is het leuk dat ik die ervaring bij de krant heb. Dat je dat dus van twee kanten kan belichten. Dat je wel weet hoe je nieuws moet maken, maar daar 1) langer de tijd voor hebt en 2) dus ook gedegener kunt doen.

206

NERD MET VIJF POTEN

MASTERSCRIPTIE JAN KRUIDHOF

Die doelstelling, van twee kanten dingen belichten, afstand nemen, is dat ook omdat jullie denken dat de doelgroep dat wil? Of: voor ons is dat nodig? Zo is het programma opgezet. Altijd Wat is opgezet als een opinieprogramma dat eigenlijk een ander licht wil laten schijnen die spelen in onze samenleving. Het zijlicht laten zien. Nu heb ik zelf bij Tegenlicht stage gelopen en daar schreef de voormalig eindredacteur eens: Je moet kijkers ook geven wat ze juist niet willen zien. Gewoon zelf maken wat je belangrijk vindt. Wij kunnen dat hier ook wel maken, maar een eindredacteur wordt volgens mij ook afgerekend op marktaandeel. Maar jullie kunnen in principe wel.. ..in principe kunnen wij alles maken. Het programma bestaat nu twee jaar, denk ik? Ja, ik ben er dus sinds 1 april bij. Is de doelstelling voor zover jij weet sinds het begin of sinds jij er bent nog veranderd? Je merkt wel dat er af en toe discussie is over wat je wilt uitdragen dat gaat vooral over welke items je wel en niet wilt. Er zijn nu vijf categorieen en er gaan stemmen op die zeggen: Dat is teveel, kaleidoscopisch eigenlijk. Ja, ik kan het zelf niet zo goed duiden, want ik was ook niet bekend met het programma, voor ik hier zat. Ik had gek genoeg ook helemaal geen televisie, toen ik hier kwam werken. Wel een toestel, maar geen kabelaansluiting. Was meer een uitvloeisel van een conflict wat ik had met de kabelmaatschappij en toen dacht ik: Ik vind het eigenlijk wel lekker zonder. Is gezondheidszorg iets wat jullie nu wel regelmatig in de gaten houden? Ja. Ik misschien niet, maar mijn collega wel. Er is niet n onderwerp dat je in de gaten houdt, als je specialisme? Er zijn wel een aantal onderwerpen waar ik hierna mee aan de slag wil en daarvan hou ik wel in de gaten wat er gebeurt. Zijn er bepaalde websites de je in de gaten houdt?

207

NERD MET VIJF POTEN

MASTERSCRIPTIE JAN KRUIDHOF

Ik moet eerlijk zeggen dat ik dat heel weinig doe. Ik kijk wel regelmatig op het datablog van The Guardian, maar eigenlijk verder niet zoveel. Dat zou ik wat meer kunnen doen. Maar bijvoorbeeld de site van het CBS? Nee. Ik zit wel regelmatig in Statline en Eurostat te neuzen, maar dat is pas op het moment dat ik denk dat daar iets is wat ik nodig heb. Dat is wel echt anders dan bij andere media. Jerry vertelde bijvoorbeeld dat zijn weekplanning wordt beinvoed door het CBS. Wat hij waarschijnlijk doet.. Ik ken hem verder niet hoor, maar ik heb wel wat dingen gezien die hij heeft gedaan. Bijvoorbeeld voor Nu had hij een graphic gemaakt waar alle spelers op het Europees Kampioenschap, uit welke competities die komen. En dat heeft in principe natuurlijk niets met nieuws te maken, dat is gewoon een dingetje en dan denk je: Oh ja, ze spelen allemaal in Engeland en Italie. En ik neem aan dat hij dat ook doet met die CBS-cijfers. Dat is meer een technisch ding. Hij maakt daar iets moois en inzichtelijks van. En in die zin is het heel anders. Daar kun je op televisie natuurlijk ook niet zoveel mee. Op televisie is het nog niet een halve minuut zendtijd als je laat zien waar alle spelers vandaan komen. Jij bent echt op zoek naar een verhaal, een ontwikkeling? Ja, dat moet wel. Maar goed, dat zul je zelf ook.. Maar dat is niet het onderwerp van dit gesprek. Je zei net dat je dingen inzichtelijk wil maken voor mensen of dat ze Schande zeggen. Wat zijn andere aspecten die een onderwerp interessant maken voor jou? Specifiek als je wel met datajournalistiek bezig bent. Het moet het dagelijks leven van mensen raken. Dat is wel een criterium. De zorg staat heel dicht bij mensen omdat veel mensen daarmee te maken hebben. Dat is n. En twee: je moet toch tegels lichten, een inzicht bieden wat er anders niet was geweest. En inzicht moet het Ohja-niveau wel ontstijgen. Gebeurt het wel eens dat je een onderwerp hebt, dat het wel een beetje schokkend is, maar dat het afvalt omdat het nt niet is? Nou, bijvoorbeeld dat SP-verhaal.. Ik bedoel, dat hadden we net zo goed niet kunnen maken, want het is wel een beetje een Ohja-verhaal. Want we weten dat de SP vrij radicaal is in haar

208

NERD MET VIJF POTEN

MASTERSCRIPTIE JAN KRUIDHOF

standpunten, ideologisch. Dus verwondert het niet dat ze weinig medestanders vinden in de Kamer. Dus dat had je net zo goed niet.. Als je het criterium wat strikter had genomen.. Maar omdat de verslaggevers er een verhaal in zagen.. Ik had de data en zij zagen het SP-verhaal; dan maken zij het SP-verhaal en lever ik de data. Dan maak ik dat inzichtelijk. Gebeurt het vaak dat je ergens mee bezig bent en het is niet wat? Dat gebeurt wel eens. Ik sluit helemaal niet uit dat je ergens mee bezig gaat en zegt: dit is niets. Je mailde al: ik weet niet veel van workflows. Maar laten we toch even kijken of we iets kunnen ontdekken. Hoe ziet jouw week er bijvoorbeeld uit? Nu zijn wij bezig met een uitzending voor begin december. En daar komt ook een flink deel internet straks bij kijken, dat waarschijnlijk al wel voor vijf december klaar moet zijn. Nu ben ik heel erg met het verhaal bezig, om te zorgen dat alle elementen die wij in het verhaal willen, dat die duidelijk worden. Welke tegels zijn er te lichten? Wat voor invloeden zijn er bloot te leggen? Dus ik ben gewoon aan het zoeken. Ik ben dagen aan het zoeken, ik ben me aan het verdiepen, ik ben achtergrondgesprekken aan het inplannen en aan het voeren. Hoe lang ben je dan ongeveer bezig per uitzending, denk je? Dat is lastig te zeggen. Kan soms ook wel een beetje inefficint gaan. Bij de verkiezingen was eerst wel, dan weer niet, dan weer wel. Een heleboel informatie is ook niet gebruikt. Ik had bijvoorbeeld ook alle aanwezigheid in kaart gebracht. Daarvan hebben we alleen gezegd dat Henk van Gerven, een van de SPers, dat die in de top-3 aanwezigen stond. Maar ik had een hele database met alle aanwezigen. Dus je gaat ook heel veel.. Ik vind het moeilijk om te zeggen, maar de afgelopen.. De eerste twee maanden ben ik met de zorg bezig geweest, de maand daarop ben ik met deze verkiezingen bezig geweest, toen ben ik begonnen met duurzaamheid en toen ben ik daarna weer twee weken met verkiezingen bezig geweest. Maar je duikt dus sowieso wel twee weken in een onderwerp? Ja. En hoe begin je dan? Je zou kunnen beginnen met het opvragen van de database. Gewoon het downloaden van een database, natuurlijk. En daar ga je dan eens in zoeken, gewoon kijken. Bijvoorbeeld, nu ben ik

209

NERD MET VIJF POTEN

MASTERSCRIPTIE JAN KRUIDHOF

bezig met.. Nederland gebruikt erg veel energie per hoofd van de bevolking. Dan ga je naar de Wereldbank toe en die hebben en een database van het energieverbruik per hoofd van de bevolking van ontzettend veel landen. En dan ga je kijken hoe dat voor Nederland zit, je gaat vergelijken met andere landen. Dan ga je kijken of je met die dataset iets moet of dat je aan dat gegeven an sich genoeg hebt om in dit geval een rol te spelen in je verhaal. En voor nu denk ik: Ik hoef daar verder niet mee aan de slag. Volgens mij is het genoeg dat ik gewoon kan zeggen dat Nederlanders enorm veel energie verbruiken. Veel meer dan het gemiddelde van Europa, ten opzichte van Duitsland, enzovoort. En dat is gewoon een Excel-bestandje? Dit is een soort applicatie op de website, geen Excel-bestand. Die hoef je niet te gaan scrapen ofzo? Nee. Je checkt gewoon de cijfers? Ja, daarmee kan ik in dit voorbeeld aan de slag om een soort opzet te maken. En dan? Dan ga je nadenken: Wat heb je nog meer nodig voor het verhaal? En dan vanuit de gesprekken die ik heb gevoerd met mensen die of wel in de uitzending komen of niet in de uitzending komen, probeer ik met de informatie die zij mij geven ook weer te kijken of ik daarmee iets kan. Want zij wijzen soms op documenten, zij wijzen soms gegevensverzamelingen, zij wijzen soms naar andere personen. En dan vervolgens al die informatie in een overzichtelijk verhaal stoppen? Ja, ik probeer nu gewoon een opzet te maken van een paar kantjes. Zodat je een beetje het verhaal kun zien. En kijken wat je mist. En wanneer komt er dan een camera bij kijken? Als wij vinden dat iemand een goed verhaal heeft en die iemand wil dat verhaal ook wel op televisie vertellen dan komt de camera erbij kijken. Dat is dus pas helemaal aan het eind van het traject?

210

NERD MET VIJF POTEN

MASTERSCRIPTIE JAN KRUIDHOF

Ja. Zo ben ik ingesprongen in een verhaal over technologie, maar dat is eigenlijk meer ontstaan omdat ik een aantal bronnen had die wel op televisie wilden vertellen en dan ga ik ook mee met de verslaggever en mocht die dingen vergeten te vragen of niet weten dan kan ik inspringen. Ga je altijd mee met de gesprekken? Nee, niet altijd. Maar dan brief je iemand al van tevoren? Ja, inderdaad. Bij de verkiezingen zorg je gewoon dat de verslaggevers overzicht hebben. Inzicht hebben in de data, de toplijstjes, dat soort dingen. En is het dan helemaal uit jouw handen of komen ze dan nog terug? Zij komen in de regel wel terug om te vragen: Vind je dit goed, vind je dat goed? Maar de ene verslaggever trekt natuurlijk meer zijn eigen plan dan een andere verlaggever. En ga jij altijd naar de internetjongen toe, als dat nodig is? Of geeft de verslaggever aan wat voor graphic hij wil? Wij hebben een samensteller en die is daar nog wel eens bij betrokken. Bij het SP-verhaal was ik gewoon diegene. En bij het verhaal van de zorg hebben we een boodschappenmandje gemaakt. Wat kos een heupoperatie, het plaatsen van een pacemaker en een staaroperatie? Dat zijn drie operaties waar ontzettend veel omzet in zit in Nederland. Wat kost die in welk ziekenhuis? Dat heeft hij ook een beetje aangezwengeld. Hij vond dat interessante informatie en zei: Laten we daarmee uitpakken. In die zin ging dat toen anders. En de samensteller is de rechterhand van de eindredacteur. Doen jullie ook aan updates? Op de website? Nee, dat doen we niet. Maar dat zijn wel dingen waar we nu over aan het nadenken zijn. Ik neem aan dat je de website bezocht hebt; dat is niet wereldschokkend, niet een plek waar je de hele dag gaat rondneuzen. Je moet natuurlijk ook kijken of een grafiek niet te saai is of een infographic juist te ingewikkeld. Dat heb ik vaak met die Google Fusion Tables, tenminste bij de kaartjes. Daar heb ik weleens mee lopen knoeien en dat is hartstikke leuk, vooral voor de vakidioot, maar ga maar eens zelf van heel Nederland bijvoorbeeld de cijfers over werkloosheid relateren aan de

211

NERD MET VIJF POTEN

MASTERSCRIPTIE JAN KRUIDHOF

verkiezingsuitslag. Dat leek me op zich wel leuk, hoeveel uitkeringsgerechtigden er in een bepaalde gemeente zijn en wat ze dan gestemd hebben. Maar dan krijg je dus 450 van die dingetjes en dan ga je alleen maar op zoek naar je eigen gemeente, natuurlijk. Maar jullie graphics bij de Altijd Wat Wijzer zien er wel overzichtelijk uit. Maar in principe heeft dit niets te maken met datajournalistiek zoals ik het beschreven zie. Want wat wij doen, en ik doe dat meestal niet overigens, er is een redacteur die verantwoordelijk is voor de Altijd Wat Wijzer en die schrijft een verhaaltje op basis van dingen die hij heeft uitgezocht. Daar schrijft hij eigenlijk een artikel van. En dat artikel dat is de voice over. En die gaat naar dat bureautje dat dat voor ons maakt en die maken er iets van, die tekenen dat erbij. Dus eigenlijk is het een krantenartikeltje met graphics? Ja, het is eigenlijk een soort gesproken column met heel veel feitenmateriaal. In die zin.. Het is geen motion graphic, dat is het allemaal niet. Maar ik vind het wel een hele goede manier om vaak toch redelijk complexe materie aantrekkelijk op de buis te brengen. Het ziet er voor een kijker uit als datajournalistiek, maar de totstandkoming is niet echt datajournalistiek. Je moet natuurlijk wel beseffen: datajournalistiek is nu een hype en of het echt iets wordt, dat moeten we zien. Want dat moet natuurlijk op een gegeven moment wel echt iets gaan toevoegen. Dat blijft de vraag. Het is goed dat journalisten steeds beter zelf eigenlijk kunnen grasduinen in data, want dat is voor hun eigen informatiegaring van belang. Dat je ook weet hoe je in Excel met behulp van een draaitafel bijvoorbeeld eenvoudig allerlei aantallen inzichtelijk kunt maken voor jezelf. Dat lijkt mij het meest belangrijk. Nu lijkt het erop dat veel mensen het interessant vinden om ook echt iets met de oorspronkelijke data op internet te doen. Of dat zo blijft is wel de vraag. Simon Rogers, van The Guardian, zei: Datajournalistiek zal wel blijven, maar op een gegeven moment is het gewoon journalistiek. Denk jij dat ook? Ik denk dat sowieso. Nou is het nog niet zo.. Ik weet niet hoe oud jij bent? Vijfentwintig.

212

NERD MET VIJF POTEN

MASTERSCRIPTIE JAN KRUIDHOF

Ook van jouw generatie kan nog niet iedereen met een database overweg. Wat mij verbaast, maar dat is dus wel zo. Dus er zullen nog wel een paar generaties overheen gaan, voordat dat heel gewoon is. Maar misschien gaat het ook wel een beetje op een andere manier. Je moet wel feitelijk wllen zijn. Want het is wel vrij feitelijk. Het is geen human interest interview. Je moet niet op zoek gaan naar de gesproken waarheid, maar je moet echt op zoek willen naar die feitelijkheden. Mis jij dat nog wel eens, die human interest kant? Nou ja, je gaat namelijk onbewust in je leven ook heel feitelijk denken. Je gaat mensen die je spreekt ga je beoordelen op of wat ze zeggen wel juist is. Of je dat nu echt helemaal moet doortrekken moet je je ook afvragen. Ik heb er weinig zin in om zon kommaneuker te worden. En als voor een reportage nog een persoonlijk verhaal gewenst is? Dan zal ik dat waarschijnlijk wel naar me toe trekken, omdat ik dat ook leuk vind. Ik probeer mijn portefeuille wel een beetje zo uit te breiden dat ik ook dat soort dingen kan doen. Even checken: ik neem aan dat de webpaginas en de uitzendingen aan elkaar gekoppeld zijn? Dat de website synchroon loopt met de uitzendingen? Nu nog wel. Dat gaat misschien anders worden. Dat je op de website iets ziet waar het in de uitzending niet over gaat? Dr hebben wij geen mensen voor. Dan moet je daar eigenlijk een hele redactie voor hebben. Maar het zal wel altijd gelieeerd zijn aan een uitzending, omdat we nog steeds een televisieprogramma zijn. Maar er wordt natuurlijk overal nagedacht over het breder trekken van dat televisie. Dat mensen die televisie maken meer over internet moeten nadenken en dat hele tweede scherm-gedoe. Dat is natuurlijk wel ideaal: dat je een uitzending bekijkt en op je iPad de visualisaties kan bekijken. Dat zijn wel dingen waar we over nadenken. Feit is dat natuurlijk wel steeds meer mensen zon iPad hebben. Je vertelde net over je werkwijze, dat je nadenkt wat voor een verhaal nodig is -

213

NERD MET VIJF POTEN

MASTERSCRIPTIE JAN KRUIDHOF

Het is dus niet zo dat ik een concept heb. Dat ik een werkwijze heb en dat ik weet aan het begin van een onderwerp: eerst ga ik dit doen en dan dat. Dat zou misschien wel meer kunnen, maar op dit moment doe ik dat niet. Wat betreft jouw werkervaring: je hebt stage gelopen bij het NRC.. Ja. Ik ben bij de Volkskrant terecht gekomen na mijn studie Frans met Europese Studies. Toen ben ik min of meer bij toeval terecht gekomen bij de Volkskrant, op een onderzoeksfunctie. Dat waren eigenlijk studentenbaantjes. En toen ben ik tussendoor weggeweest naar Rome, daarna nog een beetje gezworven langs allerlei, Stadstoezicht zelfs. Toen teruggekomen bij de Volkskrant op hetzelfde onderzoek. Maar dat kun je ook wel op LinkedIn vinden. Bottomline is: toen ben ik teruggekomen bij de Volkskrant op dat onderzoek en toen dacht ik: Ik wil straks niet weer bij dat soort rare baantjes terechtkomen als Stadstoezicht dus ga ik doen wat logisch is ten opzichte van mijn CV en toen heb ik een journalistiekopleiding gevolgd in Rotterdam, de PDOJ. En toen ben ik bij de NRC terechtgekomen op de binnenlandredactie. Toen weer terug bij de Volkskrant op het onderzoek over invloedrijke Nederlanders. Toen ook nog over straffen, voor Moord en Doodslag, in de afgelopen vijf jaar. Toen hebben we nieuws gemaakt met het feit dat.. Dat is in principe ook datajournalistiek, dat vind ik ook wel een punt. Datajournalistiek gaat nu heel erg over bestaande datasets. En wat wij eigenlijk deden bij de Volkskrant is: wij maakten zelf een dataset. Als je zelf een dataset maakt, dan heb je 1) een dataset die niemand anders heeft en daar kun je dan ook op voortborduren. Want nu is er dus een dataset met alle uitspraken. Dus ik heb een Excel-bestand gemaakt met links naar tekstbestanden waar de uitspraak in staat. En heb ik in de verschillende velden gewoon ingevuld wat de eis was, van justitie en wat de uiteindelijk straf was. En wat was hiervoor de uitgangsvraag? Wij wilden weten of er een ontwikkeling was in de strafmaat. De directe aanleiding was natuurlijk de minimumstraffendiscussie. En wat blijkt dus: rechters luisteren al naar de roep vanuit de samenleving om zwaarder te straffen. Ik las laatst in een onderzoek uit Amerika dat hoe langer een rechter zijn pauze achter de rug heeft, hoe zwaarder hij straft. Dat is ook echt wel fascinerend. Dat is dus ook weer zelf data zoeken. Iets nieuws maken.

214

NERD MET VIJF POTEN

MASTERSCRIPTIE JAN KRUIDHOF

En Dimitri had dan waarschijnlijk een of andere automatische scraper gemaakt die het allemaal in een database stopte. Dat heb ik niet gedaan. Ik heb gewoon al die teksbestandjes geopend en dan weet je gauw genoeg waar staat ongeveer de strafmaat. Dat is vrij analoog, beetje oude techniek. Die scrapertechnologie die beheers ik niet. Wat heb je jezelf wel aangeleerd? Ik heb geprobeerd mij alle krochten van Excel eigen te maken. Dat gaat heel aardig. Maar niet programmeertalen enzo? Ik heb wel in MySQL een database gemaakt. Je moet er gewoon aan beginnen. Het is niet zo heel ingewikkeld. Je moet wel dat feitelijke hebben. Bij een MySQL is het wel anders dan bij een human interest-interview. Je moet wel precies opschrijven wat er moet staan, wil de code werken. Dat je het leuk vindt om na een foutmelding het hele ding door te gaan op zoek naar de fout. Ja, dat moet je hebben. Maar goed, ik kwam hierop omdat ik zei dat ik Moord en Doodslag had gedaan en toen heb ik gesolliciteerd op een functie als economiejournalist en toen ben ik aangenomen. Toen heb ik vier, vijf, zes maanden als economiejournalist gewerkt. Dat is bij de Volkskrant altijd in freelancecontracten. Jonge mensen kunnen daar niet zomaar in dienst worden genomen omdat de eigenaar dat niet wil. Mondjesmaat werd er eens iemand aangenomen. Op een gegeven moment dacht ik: Ik wil ook gewoon in loondienst en toen heb ik hier gesolliciteerd. En jullie hebben ook nog weleens samengewerkt met Sargasso, toch? Ja, dat hebben we geprobeerd. Met die aannemersprojecten, maar dat was niet zon succes? 1. De crowdsourcing werkte niet. Nou weet ik ook niet zeker of ons publiek het publiek is dat je moet bevragen over dit soort onderwerpen. Omdat wij een wat ouder kijkerspubliek hebben. Dus dat zal een van de redenen zijn geweest. 2. We speelden nog wel met de gedacht om dat op een andere manier in kaart te brengen, via lokale media ofzo. Maar dat is er tot op heden niet van gekomen. En Dimitri is daarvoor langs geweest. Hij is ook wel eens langsgeweest om na te denken over het zorgverhaal. Maar we hebben toen besloten dat we dat wel alleen konden.

215

NERD MET VIJF POTEN

MASTERSCRIPTIE JAN KRUIDHOF

Waar ik wel benieuwd naar ben: Jelle Kamsma, die is verdwenen bij RTL. Waarom? Geen idee. Hij had op een forum wel laten weten dat hij het spijtig vond. Dat laat wel zien dat het pionieren is. Want blijkbaar liepen de verwachtingen uiteen ofzo. En heeft RTL gedacht: dan gaan we dat anders doen ofzo. Ik heb hier ook gezegd.. Hun aanvankelijke insteek was: We gaan iets groots en fantastisch doen. Elke drie maanden willen ze iets groots brengen. En dan moet groter worden dan alleen een uitzending. Maar dan moet je wel een onderwerp hebben dat 1) zich daarvoor leent en 2) moet er ook wel iets boven water komen. Dus je moet beginnen met het vinden van onderwerpen of het vinden van nieuwshaakjes waar je wat mee kunt. En daar moet je dan op dooronderzoeken en kijken of dat zich leent voor iets. Dus dat zijn we nu aan het doen en op het moment dat er echt iets groots is kun je daar groot mee uitpakken. Maar ik ben principieel tegen dat je eerst in de vorm denkt en dan daar inhoudelijk iets bij gaat zoeken. In dit geval was dat: We willen een scoop en zorg jij maar dat er iets komt. Nou, het hoefde het scoop te zijn, maar wel iets wat heel groot was. Excel, MySQL Acces deden we [bij de Volkskrant]. Maar ik kan nog niet zelf een Acces-database ontwerpen. Dat zal niet veel afwijken van MySQL maar op dit moment kan ik dat nog niet. Ik wilde nog vragen naar jullie voorbeelden, maar Altijd Wat is natuurlijk een redelijk nieuw format. Ja. Eigenlijk is het meer een magazine-achtig format. Een beetje Vrij Nederland op televisie. De organisatie.. Wat is jouw rol binnen de redactie? Is het een eilandje? Het is een beetje een eilandje, ik zwem een beetje tussen de verslaggevers en de redacteurs. Ik zit nu aan het redacteursblok toevallig. Ja, het is wel een eilandje. Maar ze weten je wel te vinden? Ja, het contact is heel goed. Maar qua functie is het een eilandje. En andere programmas van de NCRV, komen die weleens kijken hoe jullie data aanpakken? Nee, toen met de SP is er wel doorgepakt in een radioprogramma, Cappucino.

216

NERD MET VIJF POTEN

MASTERSCRIPTIE JAN KRUIDHOF

Maar dat had ook van een andere omroep kunnen zijn? Ja. Hoe is dat uberhaupt bij de NCRV, is er veel contact tussen programmas? Kijk, de mensen hier werken hier al wat langer. Sommige mensen hebben goede contacten, ook omdat ze bij een andere programma hebben gewerkt. Mensen die van Knooppunt Kranenbarg komen. En het is eigenlijk de oude redactie van Netwerk he, die het programma nu maken. Die zijn wel geworteld in de NCRV. Maar niet dat je onderwerp gezamenlijk aanpakt van verschillende kanten? Nee. En jij bent nog de enige datajournalist of hoe wil je dat noemen? Ja, zo staat het nog op mn.. Maar eigenlijk noem ik mij een datajournalist sinds ik op die vacature heb gereageerd. En vervolgens heb ik binnen die vacature wel aangegeven dat ik niet alleen maar een datajournalist ben, maar liever als een algemeen onderzoeksjournalist beschouwd wil worden. Want je zei: de eerste paar maanden heb ik fulltime aan datajournalistiek gewerkt, maar hoe groot is het data-aspect nu in je werk? In het huidige onderwerp zal de data echt een ondergeschoven kindje blijven. Dus het verschilt echt per onderwerp? Ja. Met die amendementen was het weer alleen maar data. Zijn er dingen die jij nog graag zou willen die nu nog niet echt kunnen? Bijvoorbeeld Dimitri zei dat hij graag een programmeur zou willen. Heb jij nog wensen? Nu nog niet. Maar dat komt ook omdat ik zelf nog een beetje zoekende ben. Maar ik sluit dat niet uit. Je hebt twee dingen die altijd handig zijn. Mensen die gewoon handwerk kunnen verrichten. Dus wat ik gedaan heb met die ziekenhuisbehandelingen: iemand anders zou ook die gegevens kunnen verzamelen en dan had ik alle PDFjes gewoon en dat had ik in n middag.. Maar goed, daar ben ik veel meer tijd aan kwijt geweest. Maar je moet natuurlijk wel zeker weten dat je werk hebt voordat je mensen gaat inhuren. Een programmeur, daar zou ik de echte concrete toepassing nog niet voor weten. Daar is Dimitri veel verder mee.

217

NERD MET VIJF POTEN

MASTERSCRIPTIE JAN KRUIDHOF

Een andere vraag: je hebt mensen die beginnen met een vraag, maar je hebt ook datajournalisten die gewoon schudden aan een dataset tot er iets uitkomt. Ik ga met een vraag een dataset in, anders verdwaal ik. Maar goed, je kunt natuurlijk.. Ik neem dat als je aan een dataset gaat schudden, dat je dan ook aan de hand van een aantal vragen aan het schudden bent. Bijvoorbeeld: je hebt een dataset met alle declaraties van alle hoge ambtenaren, dan ga je eerst eens kijken: Wat is de hoogste declaratie? Zijn er nog dingen waarvan je denkt: die hebben we over het hoofd gezien? En wat zou je een beginner willen meegeven? Kijk uit. Ik zou zeggen: Kijk uit. Je moet uitkijken dat je goed weet wat je precies wilt doen. Of dat geschikt is voor het medium waar je voor werkt. Want iets in kaart brengen kan voor tv minder werken bijvoorbeeld? Ja. En ik denk dat een groot deel van het succes ook ligt in het hele simpele handwerk. Want dan krijg je de meest unieke gegevensverzameling. En dat is natuurlijk ook de kritiek van iemand als Dick van Eijk, he. Want ik heb het blog van Jerry Vermanen wel een beetje meegekregen, van die hele beweging en dat Mozillaboek. Dan zegt hij: De datajournalistiek is geboren. Dat schiet Dick van Eijk natuurlijk in het verkeerde keelgat, die denkt: Hoezo? We zijn al heel lang bezig met datasets. Maar hij heeft natuurlijk ook gewoon keurig handwerk gedaan en nu knalt de overheid eigenlijk datasets de wereld in en dat is een andere manier van werken. Maar je kunt natuurlijk wel verwachten dat daar geen hele schokkende dingen in zitten, als de overheid dat zomaar.. Dan moet je echt heel creatief zijn, wil je dat met allerlei verschillende informatie.. Maar je ziet wel dat het CBS nu wel de agenda van sommige datajournalisten bepaalt. Dat is in ieder geval journalistiek gevaarlijk. Doordat er minder mensen op de nieuwsredacties werken komt een KPMG-rapport over het vestigingsklimaat in verschillende Nederlandse gemeenten gewoon rechtstreeks de krantenpaginas op. Terwijl ik denk: Waarom? Hoe kan een KPMG-rapport nou nieuws zijn? Want je kunt helemaal niet achterhalen hoe ze onderzoek gedaan hebben. Daar lijkt het dan een beetje op. Je moet er wel mee uitkijken, vind ik, denk ik.

218

NERD MET VIJF POTEN

MASTERSCRIPTIE JAN KRUIDHOF

Andr Tak (RTL Nieuws) Wat is uw doelstelling als u bezig bent met datajournalistiek? Wat wij willen doen is voor ons publiek of gebruiker zoveel mogelijk gegevens waar hij zelf ook wat aan heeft inzichtelijk maken. En dan eigenlijk het liefste op zon manier dat het is te koppelen aan de manier waarop je woont. Dat is eigenlijk de belangrijkste doelstelling. Zodat mensen kunnen zien van, wat zijn de bepaalde prestaties op verschillende onderwerpen van de plek waar ze wonen ten opzichte van andere plekken. Hebben jullie vanaf het begin voor die insteek gekozen, om het te koppelen aan woonplaatsen? Ja, daar hebben we voor gekozen, omdat we er van uit gaan dat mensen dat mensen dat het meest interessant vinden. Moeten jullie items ook per se nieuws zijn of kan het ook inzicht verschaffen in iets wat op zich al wel bekend is? Dat kan allebei. Maar het belangrijkste is toch wel dat het nieuws moet zijn, want wij gaan er ook een onderwerp voor maken van televisie, dus het eigenlijk sowieso nieuws zijn. Als het om een aardigheidjes gaat.. Daar kunnen we weinig mee, als nieuwsorganisatie. Want ieder onderwerp wat jullie op het vlak van datajournalistiek doen moet ook geschikt zijn voor televisie? Ja. Sterker nog: het moet de opening zijn voor televisie, dus het moet wel nieuws zijn, ja. Anders doen we het niet. Wat betreft onderwerpen: hoe komen jullie op jullie ideen? Dat is een goede vraag. Daar ga ik niet alles over vertellen. Je kan natuurlijk in zijn algemeenheid nadenken over wat onderwerpen zijn die mensen over het algemeen interessant vinden. Die ook het meest leven als je op een bepaalde plek woont. Als je daar over door gaat denken dan kom je op wel een heleboel onderwerpen. Daar moet je wel even voor gaan zitten. Zijn er bijvoorbeeld ook mensen die naar jullie toekomen met datasets? Nee, nee, dat gebeurt sowieso.. Mensen hebben altijd het idee dat onderzoeksredacties bestookt worden ideeen van buiten, maar dat is verwaarloosbaar. Ik denk dat er bij onze

219

NERD MET VIJF POTEN

MASTERSCRIPTIE JAN KRUIDHOF

onderzoeksredactie op jaarbasis misschien n tip binnen komt van buiten waar je wat aan hebt. Dus daar hebben we met datajournalistiek helemaal weinig van te verwachten. Ik hoorde van andere redacties nog wel eens dat ze bijvoorbeeld wetenschappers met datasets hadden of andere organisaties, maar dat gaat bij jullie vooral van jullie zelf uit. Jullie eigen ideen, daar gaan jullie mee aan de slag. Ja. Er zijn heel veel datasets beschikbaar, maar ik kan bij allemaal afvragen of het wel zo interessant is. Het is misschien wel interessant, maar niet voor de doelgroep waar wij het programma voor maken. Ik verwacht wel dat de ontwikkeling verder komt dat er later steeds meer interessante gegevens zijn, maar nu vind ik dat nog tegenvallen. Waarom vindt u het precies tegenvallen, als ik vragen mag? Omdat het niet interessant is. Het zijn allemaal gegevens, maar je zou je kunnen afvragen waar je daar nu precies mee moet. Er is wel een ontwikkeling dat er.. Er was laatst iets over parkeergarages. Daar heb je op zich wat aan. Daar kun je als gebruiker wat mee. Maar daar kun je weer de vraag bij stellen: is het nieuws? Nee, dat is geen nieuws. Dat zullen wij dan niet zo gauw doen. Snap je? Maar het is wel weer een voorbeeld van informatie die wel interessant voor een gebruiker kan zijn. Maar de combinatie n interessant voor de gebruiker n nieuws, dat zit er in ieder geval niet bij gegevens die wij nu vinden. Als we het hebben over interessant voor de gebruiker, begrijp ik dan goed dat het herkenbaar moet zijn in je dagelijks leven, bijvoorbeeld met gevaar te maken hebben.. Echt invloed hebben op de directe levenssfeer van de gebruiker. Ja, helemaal goed. Inderdaad. Wat betreft jullie werkwijze: hebben jullie een vaste structuur bij dataprojecten? Eh ja, wat wij hebben is een klein groepje mensen wat gespecialiseerd is in bepaalde taken. We hebben natuurlijk gewoon iemand die heel erg handig is in het omgaat met Excel-bestanden. We hebben weer inhoudelijk mensen die ideeen bedenken en die gegevens opvragen. En we hebben ook nog iemand die er goed in is om dat allemaal op internet te krijgen. Want daar zijn allemaal tools voor nodig die ontwikkeld moeten worden, waarop je makkelijk kan zoeken. Dus er is niet n persoon die alles kan. Dus we hebben dat een beetje verdeeld en iedereen heeft zijn eigen taak. Iemand die inhoudelijk ermee bezig is, die weet wel van het bestaan van Excel en die kan misschien wel iets, maar als het om grotere bestanden gaat hebben we iemand anders. Zo

220

NERD MET VIJF POTEN

MASTERSCRIPTIE JAN KRUIDHOF

hebben we ook weer iemand anders die ervoor zorgt dat het goed op internet komt. En hebben jullie ook een programmeur? Eh ja, die gegevensprogrammeur hebben we ook. Die dus uiteindelijk de tool maakt, dat doet de technische dienst. Die maakt dat in orde. Maar die zijn niet constant fulltime ermee bezig, maar dat is een deel van hun taken. Maar wat betreft het proces zelf. Stel, je hebt een idee. Gaan jullie dan direct op zoek naar data of hebben jullie de data al in handen? Wat is de volgorde van de stappen die jullie nemen? Nou, je zult eerst een goed idee moeten hebben. Als je dat hebt zul je je moeten afvragen van: waar liggen die gegevens? Zijn die gegevens uberhaupt voor handen? Zijn ze makkelijk voor handen of ingewikkeld voor handen? En welke methode moeten we dan doen om die binnen te krijgen? Gewoon n telefoontje en vragen? Of moeten we daarvoor een WOB-procedure starten? Of moeten we iets anders doen? Nou, op een gegeven moment komen die gegevens en dan zal bekeken moeten worden hoe het aangeleverd is. Is dat allemaal eenduidig aangeleverd of afwisselend? Moeten er dan bijvoorbeeld nog extra gegevens opgevraagd worden om het allemaal gelijk te krijgen? Dan gaat diegene die in Excel gespecialiseerd is op basis van die gegevens die we hebben de meest interessante vragen stellen. Ook zoekvragen ontwikkelen. Afhankelijk van de antwoorden kijken we dan wat journalistiek gezien het meest interessante is. Wat de kop van het verhaal kan worden voor het tv-item. En op het internet kunnen we natuurlijk wat breder uitpakken. En kunnen we ook andere interessante gegevens, dingen die we niet in het item kunnen stoppen, ook allemaal kwijt. En de tool kan dan ontwikkeld worden. En de verschillende verhalen op internet kun je er meer verhalen uithalen dan op tv, om het zo maar te zeggen. Zo gaat dat dan een beetje. Dus er is wel een redelijk vast stappenplan? Ja, op zich wel. Want ik heb ook wel eens van een van de andere genterviewde journalisten gehoord dat hij in het verleden begon met een vraag en dan op zoek ging naar de data, maar hij zei dat hij er dan vaak tegen aan liep dat de data dan niet volledig was of niet betrouwbaar genoeg of niet actueel genoeg dat hij uiteindelijk toch het onderwerp moest cancellen. Dat hebben wij nooit. Dat komt.. Ik snap het wel. Maar dan heb je in het begin niet goed gekeken of de data wel beschikbaar is en waar. Je moet je dat echt heel erg goed realiseren in het

221

NERD MET VIJF POTEN

MASTERSCRIPTIE JAN KRUIDHOF

begin. Je kunt allerlei interessante vragen bedenken, maar of het allemaal beschikbaar is, dat is net de grote valkuil. En meestal is het namelijk niet beschikbaar of niet alles of precies de vragen die jij ook noemt. Dus je moet dat in het begin heel erg voor jezelf helder hebben. Want alles stap je echt in de valkuil dat je er een paar weken later pas achter komt. En dat kunnen wij ons sowieso al niet veroorloven, om daar na een paar weken pas achter te komen. Dus dat moet in het begin echt helder zijn. Dus eigenlijk hebben wij in die zin.. En dat klinkt misschien ten opzichte van die ander wat vreemd in de oren, maar als wij met een project beginnen, dan zal het lukken ook. Wij krijgen die gegevens dan ook. Sorry, dat laatste kon ik niet verstaan. Wij krijgen die gegevens uiteindelijk dan ook. Soms duurt het misschien wel eventjes, maar we komen er niet achter dat het niet lukt. Dat het niet kan, dat het niet beschikbaar is. Wat zijn dan jullie misschien wel favoriete manieren om aan data te komen? Welke technieken of methodes gebruiken jullie vooral? Ehm, ja. Dan hou ik het een beetje vaag. Je moet je uiteindelijk heel goed de vraag stellen.. Er worden wel heel veel gegevens bijgehouden. Je moet vanuit de andere kant denken. Waarvan je denkt dat er gegevens zijn. En hoe ze opgeslagen worden. En daar een vraag bij stellen die interessant is. Maar als je gewoon out of the blue vragen gaat stellen die je interessant vindt, dan is het maar de vraag of die gegevens op die manier bij andere partijen voor handen zijn. Dus je moet het een beetje van de andere kant benaderen en je afvragen waarom organisaties bepaalde gegevens bijhouden, met welk doel, en dan kijken of wij er wat aan zouden kunnen hebben. Je moet je een beetje verplaatsen in de andere organisatie. Dus jullie bedenken al wel voor jullie echt een vraag bedenken: wat voor data is er uberhaupt eigenlijk? Ja. Dat heeft een beetje te maken met wat je dus net zegt, dat je er anders pas later achter komt dat het er helemaal niet is. En als je het bijvoorbeeld hebt over scrapen of wobben, gebruiken jullie dat soort methodes ook veel? Wobben wel, maar scrapen niet. Bij scrapen kom je er toch dan weer achter dat het weer niet vergelijkbaar is. Of dat je echt een ratjetoe binnenhaalt. Het moet wel precies zijn he. Scrapen is ook weer een aparte techniek. Ik heb het idee dat dit nog te vroeg is op dit moment. Misschien

222

NERD MET VIJF POTEN

MASTERSCRIPTIE JAN KRUIDHOF

komt dat later. Gegevens moeten wel betrouwbaar zijn. We maken er uiteindelijk een nieuwsitem van. En als we dan hebben zitten scrapen en maar wat dingen hebben binnengehaald.. Het moet wel kloppen. Dus daar ben ik een beetje huiverig voor, op dit moment nog. Want dat hebt u wel eens gemerkt in het verleden, dat gescrapete data niet helemaal was als u dat het liefst zou zien? Mm.. Ik heb tot nu toe niet een voorbeeld gezien van heel veel dingen die gescraped zijn en wat ook uiteindelijk nieuwsverhalen zijn geworden. Ik vind het tegenvallen op dit moment. In Nederland dan. Ik sprak ook met de datajournalist van Nu. Hij zei dat hij het wobben soms als soort dreigmiddel achter de hand hield. Hij probeerde eerst gewoon om de data te vragen, omdat dat uiteindelijk voor beide partijen het snelste is. Een WOB-verzoek kost een overheidsinstantie veel tijd, maar jou ook. Dus hij probeerde het pas als laatste redmiddel te gebruiken. Doen jullie dat ook? Vragen jullie vriendelijk om de data of beginnen jullie direct met wobben? Nee, dat doen wij vanaf het begin af aan. Kijk, als je dreigt met een WOB-verzoek en er komt nooit een WOB-verzoek, dan is het dreigement waardeloos. Maar hoe reageren organisaties daar dan op? Is het makkelijk voor jullie om de data te krijgen die jullie willen hebben? Ja hoor, als de vraag tenminste goed is gesteld en die [data, JK] is ook zo voor handen, dan komt dat wel, hoor. Maar als je mensen gewoon opbelt. Als je zegt: Ik wacht met een WOB-verzoek en vrg of ik de data mag hebben, werken partijen dan ook mee of zijn ze daar huiverig voor? Ja, ik denk dat er dan toch wel iets van huiver is. Omdat ze toch bang zijn dat ze gepakt worden? Nou, dat weet ik niet. Maar organisaties zitten er toch niet op te wachten om zichzelf heel veel werk op de hals te halen, dus ja, dan is het toch wat lastiger als je dat eerst vraagt. Dus als ik het goed begrijp wobben jullie direct vanaf het begin bij overheidsorganisaties? Doorgaans, in de meeste gevallen gebruiken we daar meteen de WOB voor.

223

NERD MET VIJF POTEN

MASTERSCRIPTIE JAN KRUIDHOF

Is jullie aanpak ook nog veranderd sinds jullie begonnen zijn met datajournalistiek? We proberen het op internet wat beter te doen. Het presenteren van de gegevens was vroeger een beetje houtje-touwtje. Gewoon: alle gemeentes op een rij en dan moest je jouw eigen gemeente er maar tussen zien staan. Nu proberen we het op internet beter te presenteren, zodat het gebruiksvriendelijker is. Dat je er ook echt wat aan hebt. Die ontwikkeling moet nog verder dan nu, maar dat is wel de belangrijkste verandering. De resultaten beter proberen weer te geven. Onder datajournalisten wordt ook wel gediscussieerd over hoe je data moet presenteren: geef je de bezoeker alles op een presenteerblaadje of laat je hem ook zelf nog wat uitzoeken. Hoe denkt u hierover? Ik ben van mening dat het zo makkelijk mogelijk moet. Er zijn ongetwijfeld mensen die er ook in genteresseerd zijn om in de data te zoeken, maar dat is niet de doorsnee kijker of gebruiker. Die wil toch snel consumeren. Ik denk dat je mensen wegwijs moet maken. Wat betreft uw medewerkers: u had het net al over uw team. Hoe groot is dit precies? Wij hebben gewoon een researchredactie van zes man en die doen dat in principe allemaal. Maar niet allemaal continue. Het zal van iedereen twintig procent van zijn tijd zijn. Alles bij elkaar zullen daar misschien acht mensen mee bezig, maar allemaal als deeltijd. We hebben wel iemand die zich er langer mee bezig houdt, misschien veertig procent van zijn tijd, maar dat is wel het meeste. Het wordt verder allemaal aangevuld door anderen. En wat maakt iemand volgens u geschikt voor datajournalistiek? Het belangrijkste is dat die persoon gewoon een goede journalist is. Dat is echt het allerbelangrijkste. En je moet ook wat feeling hebben met getalletjes, dat ook. En je moet ook iets meer feeling dan gemiddeld hebben voor hoe je dat allemaal op internet zet. Maar als je geen goede journalist bent, dan val je heel snel door de mand. Dan weet je bij God niet waar je informatie moet zoeken en dan weet je ook geen goede vragen te stellen. Dus dat is gewoon het allerbelangrijkste. Er zijn ook veel vragen geweest over waarom Jelle Kamsma bij jullie vertrokken is. Was hij volgens u een goede datajournalist? Ja, maar ik ga niet over Jelle praten. Beetje rare vraag voor een scriptie.

224

NERD MET VIJF POTEN

MASTERSCRIPTIE JAN KRUIDHOF

Het was een veelbesproken onderwerp onder datajournalisten, dus ik moet hier wel naar vragen. Dan heb ik daar niets over te zeggen. Dan noteer ik dat als reactie. En wat betreft de rest van de redactie: hoe kijkt die aan tegen datajournalistiek? Is het een vreemde eend in de bijt? Nee hoor. Het levert een nieuwsonderwerp op en extra clicks voor de website, dus iedereen is er wel enthousiast over. Bij de NOS hoorde ik dat het nog wel eens lastig was om de chef ervan te overtuigen tijd en geld vrij te maken voor datajournalistiek. Hebben jullie dezelfde ervaring? Nee, dat heb ik niet gemerkt. Maar als er geen nieuws uit komt, dan snap ik wel dat niemand enthousiast is. Het doel is natuurlijk niet datajournalistiek. Het doel is nieuws brengen. En dat we daar net even andere methodes voor hanteren dan voorheen, daar moet je niet teveel de nadruk op leggen. Dat is eigenlijk helemaal niet zo belangrijk. Het gaat er uiteindelijk om wat er uit komt. En daar hebben dan net even een andere methode voor gebruikt. En het voordeel ervan is dat je er op internet meer uit kan halen. Want er gaan gewoon veel meer mensen naar die site toe. Kijk, als je constant maar je datajournalistieke methodes loopt te benadrukken, maar daar komt niets uit.. Dan kan ik me wel voorstellen dat mensen argwanend worden. Dus daar komt weer terug dat het echt gaat om de journalistiek. Ja. Nog een vraag, om terug te komen op de medewerkers. Zijn zij al langere tijd bezig met datajournalistiek of soortgelijke methoden of is dit relatief nieuw voor hen? Wat bedoel je precies? Bijvoorbeeld tien jaar geleden waren journalisten ook al bezig met databases, maar nu er meer data en tools vrijkomen trekt het onderwerp een nieuwe groep journalisten. Is dat bij jullie ook een nieuwe groep? Ja, dat is nieuw.

225

NERD MET VIJF POTEN

MASTERSCRIPTIE JAN KRUIDHOF

Komen ook andere mensen vanuit de redactie, die niet bij de onderzoeksredactie horen, naar jullie toe met data die ze tegen zijn gekomen? Dat gebeurt niet zo heel vaak. Maar dat komt ook omdat de rest van de organisatie heel erg bezig is met nieuws van de dag. Je moet er dan toch een ander oog voor hebben. Dat is geen onwil, maar mensen letten daar niet op, omdat ze bezig zijn met het verslag doen van dagelijks nieuws. Dan kom je niet heel erg gauw in aanraking met data. Daar heb ik wel begrip voor. Om u nog ruimte te geven om dingen te noemen die we nog niet hebben behandeld: zijn er nog andere dingen waar u tegen aan loopt met datajournalistiek die andere journalisten met interesse in data zouden moeten weten? Dan kom ik toch op dat je je goed moet afvragen wat je wilt hebben en waar je het vindt. Dat je daar heel goed over moet nadenken. Er wordt wel veel gesproken over de open data-beweging, maar als je daar op gaat zitten wachten, dan gebeurt er helemaal niets. Of misschien pas over een tijdje. Dat zie ik nu nog niet heel veel gebeuren. Dus je moet er echt zelf achteraan. En daarbij de goede vragen stellen. Als ik het goed begrijp maakt RTL nu ook gebruik van een fonds. Als dat traject is afgelopen, gaan jullie er dan ook mee door? Dat weet niemand. Maar in principe ga ik er vanuit van wel. Want, zoals ik al zei, het is gewoon een methode. Waarom zou je die methode opeens loslaten? Misschien in een iets andere vorm. Maar we gebruiken ook de WOB als methode. Waarom zou je daarmee gaan stoppen? En als datajournalistiek ook werkt, dan ga je daar toch gewoon mee door? Mijn verwachting is dat het uiteindelijk gewoon continu doorloopt, als automatisme. Gewoon een standaardonderdeel van de toolbox. Ja, het is een methode, zoals er nog tig andere methodes zijn. Waarom zou je dan, als de subsidie stopt, daar niets mee doen?

Tot slot nog een ding: is er een bepaald project waarop u heel trots bent? Even kijken. De laatste keer dat we wat gedaan hebben, was met de wapenvergunningen. Ik heb niet zo een ding wat er bovenuit steekt, maar noem gewoon de laatste. Daar hebben ook veel mensen op geklikt. Het was op zich wel nieuwswaardig. Niet heel erg nieuwswaardig, maar wel gedeeltelijk. Dat was toch wel een succesvol project. Nu.nl heeft het ook gedaan. Dat zijn

226

NERD MET VIJF POTEN

MASTERSCRIPTIE JAN KRUIDHOF

toch twee grote nieuwsorganisaties die dat de moeite waard vonden. Dat was op zich een succesvol project, maar dat was gewoon de laatste die we gedaan hebben. Hoeveel projecten zijn er ongeveer per jaar, denkt u? Een stuk of twintig ofzo. Is er nog iets wat u graag kwijt wilt, maar wat ik niet heb genoemd? Nee, ik denk dat je wel volledig was met de vragen. We hebben wel heel veel behandeld.

227

Das könnte Ihnen auch gefallen