Longread

Wat is big data en wat kunnen we er mee doen?


Veertig jaar digitalisering, internet en telefonie hebben wonderen verricht op het gebied van informatievoorziening en -uitwisseling, tot diep in ons dagelijks leven. Wilde je vroeger wat weten over een ver land of een zeldzaam dier, dan was de vaak jaren oude encyclopedie de eerste bron. Anders was je aangewezen op een gespecialiseerd boek of een deskundige. Nu is die informatie overal beschikbaar, actueel, uitwisselbaar, ongeacht het moment van de dag.

[gemiddelde leestijd: 17 min]

Toen ik midden jaren zeventig in Wageningen biologie kwam studeren, waren telefoons nog apparaten op het bureau of aan de muur in de gang van de studentenflat. Uitsluitend geschikt om te bellen. Je kon geen appjes sturen, Pokémon vangen, twitteren of Buienradar bekijken.

De Landbouwhogeschool was een eigen universum met tientallen bibliotheken waar al decennialang onderzoeksresultaten en de daaruit gedestilleerde wetenschap werden opgeslagen; in een klein land, via de post verbonden met de rest van de wereld. Ook was er een computer, een log, onhandelbaar ding. Je moest naar het gebouw waar hij stond opgesteld om via ponskaarten te communiceren met dit rekenwonder.

Van blocnote tot big data

Al bijna 100 jaar verzamelen onderzoekers van Wageningen University & Research een onvoorstelbare hoeveelheid informatie. Wat deden we met deze data? En hoe gaan we er de komende jaren mee om?

Bekijk de tijdlijn over digitalisering bij Wageningen University & Research

Data-explosie

De hoeveelheid informatie over de wereld en over onszelf groeit razendsnel. Om het weer te voorspellen gebruiken computers tientallen terabytes aan data die doorlopend worden aangeleverd vanuit satellieten en meetstations. Dat zijn meerdere klassieke universiteitsbibliotheken aan informatie bij elkaar, elke dag weer.

Over ons lichaam groeit de berg gegevens eveneens met duizelingwekkende snelheid. In 2003 werd het DNA van de eerste mens ontleed, in 2011 volgde nummer 1000; volgend jaar komt 1 miljoen in zicht. Een vergelijkbare data-explosie vindt plaats rond eiwitten en de stofwisselingsproducten in het lichaam, alles is routinematig te meten en wordt digitaal opgeslagen. De verwachting is dat over een jaar of vijf de hoeveelheid gegevens over lichaam en gezondheid elke paar maanden verdubbelt.

- Helaas, uw cookie-instellingen zijn zodanig dat de video niet getoond kan worden - pas uw permissie voor cookies aan

Zelf dragen we bij aan die gegevensstroom. Al hebben we daar lang niet altijd weet van. Vaak merken we helemaal niet dat we informatie met de buitenwereld delen. Via onze telefoon bijvoorbeeld - wie leest al die pagina’s voorwaarden als je een app installeert? - of zelfs achter het stuur. Moderne auto’s geven dag in dag uit gegevens door aan de fabrikant over toerental of de lengte van ritten.

Big data analytics

Het analyseren van die doorlopend uitdijende digitale gegevensberg wordt aangeduid als big data. Big staat voor groot, veel, maar er is geen eenduidige definitie wat groot dan precies is. Tegenwoordig wordt soms ook de term small data gebruikt voor het analyseren van gegevens die bij wijze van spreken nog op een Excell-sheet passen. De naamgeving is vooral een verwijzing naar Big Brother, de alwetende overheid die, zo schreef George Orwell in 1948, ons doen en laten ging bepalen. Onmiskenbaar hebben we een stap in die richting gezet, al is het anno 2017 niet per se de overheid  die ons door en door kent. 

Marketing en privacy

In de immense databestanden van Google, grote winkelketens, Whatsapp, Twitter of van autofabrikanten ligt een schat aan kennis opgeslagen over onze voorkeuren. Voor snel optrekken bijvoorbeeld; waar we op internet naar zoeken; of wat we graag eten.

Bij een analyse van Nederlandse twitterberichten bleek het woord broccoli vaak voor te komen in combinatie met wokken. Voor de groentesector was dat een eyeopener over gedrag van klanten. Snel werden recepten online gezet om de consument een handje te helpen. Klassiek is ook het verhaal van de Amerikaan die zich afvroeg waarom hij plots aanbiedingen kreeg voor luiers. Tot bleek dat zijn thuiswonende dochter, zonder dat hij het wist, zwanger was en informatie had gezocht op internet.  

Dat soort verhalen maakt mensen huiverig. Hun privéleven zweeft ergens in de cloud, gaan onverlaten daar niet mee aan de haal? Natuurlijk is het mooi als met al die kennis over ons lichaam nare ziektes worden bestreden, maar niemand wil dat zijn ziekenhuisdossier of DNA-profiel op straat komt te liggen.

Niet alleen maar een zorgenkindje

Toch biedt big data ook bredere perspectieven. Neem als voorbeeld de moderne auto die gegevens doorstuurt naar de maker. Dat is interessante informatie om het onderhoudspakket op af te stemmen, maar ook handig voor een studie naar verschillen in rijgedrag. Trekken BMW-rijders rustiger op dan mensen met een Audi; rijden Belgen behoedzamer dan Nederlanders? Als de autofabrikanten willen meewerken, liggen er met een paar muisklikken enorme gegevensbestanden bij een onderzoeker. Vroeger had die zich in veel bochten moeten wringen, tientallen, misschien wel honderden BMW- en Audi-rijders moeten opsporen en ’s ochtends met een stopwatch voor de deur moeten liggen als ze wegreden naar hun werk.

Of neem de zorg. Kennis over de werkzaamheid van medicijnen is bijvoorbeeld gebaseerd op gemiddelden, van jonge vrouwen tot oude mannen. Maar voor de goed geprogrammeerde computer is het een koud kunstje om uit te zoeken op basis van miljoenen gebruikersgegevens of het voorgeschreven medicijn echt effectief is voor iemand van tegen de 60. Of om mij op grond van mijn levensstijl gecombineerd met mijn DNA-profiel, in de supermarkt via een app richting gezondere producten te sturen.

supermarkt app.jpg

Data combineren

Big data kan in de wetenschap de hekken tussen verschillende vakgebieden laten vervagen, verwacht de in Wageningen opgeleide meteoroloog Wilco Hazeleger. Hij is directeur van het eScience Center in Amsterdam, trekker van big data voor de nationale wetenschapsagenda én buitengewoon hoogleraar Klimaatdynamica in Wageningen. Bovendien is hij ervaringsdeskundige. Meteorologen zijn grootverbruikers van data. ‘Dat groot en veel, is maar één kant van de medaille’, vindt Hazeleger. ‘Een belangrijker aspect vind ik het maken van combinaties; het aan elkaar knopen van informatie. Kunnen we onze gegevens over de weersituatie bijvoorbeeld koppelen met wat mensen zelf ervaren en delen op Twitter?’

Ook in andere wetenschapsgebieden is het interessant data te combineren, meent hij. ‘Met een spectroscoop is de eiwitsamenstelling in een tomatencel te bepalen. Dat levert een nuttige dataset op, maar die wordt nog interessanter als we hem kunnen koppelen met het DNA van de plant of met gegevens van smaakpanels. Dan link je dingen aan elkaar waarvan we vroeger niet wisten hoe we dat moesten aanpakken. Dat is het meest uitdagende aspect van big data. Zeker voor een multidisciplinaire universiteit.’

Big data in Wageningen

Veel Wageningse onderzoekers maken dan ook allang gebruik van big data, maar er moet nog een schepje bovenop om grote databestanden beter te exploreren, vindt de organisatie.

Speerpunt

Big Data is een speerpunt waar Wageningen University & Research de komende jaren op in zet. Gegevens uit verschillende bronnen op een slimme manier met elkaar combineren, biedt nieuwe mogelijkheden voor innovaties in landbouw, voeding en levenswetenschappen.

Lees meer over big data bij Wageningen University & Research in het dossier

Ook binnen die Wageningse onderzoeksdomeinen groeit de datastroom als kool. Om een voorbeeld te geven; dankzij moderne ict worden steeds vaker sensoren ingezet die in de kas of op de trekker de gewasgroei in de gaten houden en onophoudelijk hun informatie doorsturen naar de computer. Alle melkrobots samen weten bijna alles over honderdduizenden koeien.

In die brij aan gegevens zitten nieuwe inzichten en kennis verstopt, is de gedachte. Zeker als wetenschappers databestanden kunnen koppelen, bijvoorbeeld melkgift of voeropname met genetische informatie. En is er wellicht een verband tussen weidegang en de gezondheidstoestand van de koe? Ook in de voeding, de celbiologie of landgebruik groeien de databestanden exponentieel. Komen we er dan eindelijk achter waarom bij de een de pondjes er aan vliegen en de ander onbeperkt kan eten?

Hype of toekomstmuziek?

Het is broodnodig dat die nieuwe mogelijkheden verder worden aangeboord, vindt Karin Andeweg van Wageningen Livestock Research. Samen met Sander Janssen is zij aanjager en kwartiermaker voor big data. ‘Stel dat Wageningen twintig jaar geleden had gedacht dat het met ict en internet niet zo’n vaart zou lopen, dan hadden we inmiddels de deuren kunnen sluiten’, meent Andeweg.

‘Met big data verwacht ik iets vergelijkbaars. Nu lijkt het misschien een hype, maar over een paar jaar is het gemeengoed geworden. Als je big data goed benut, dan kan dat positief uitwerken op de voedselzekerheid en duurzaamheid. Over tien jaar, zo is onze verwachting, is 80 procent van het onderzoek gebaseerd op het analyseren en combineren van databestanden om zo nieuwe kennis en nieuwe handige toepassingen te genereren.’

Smartphones, drones en sensoren in Wagenings onderzoek

Die toekomst tekent zich nu al af. Wageningen University & Research doet mee aan een proef in Amsterdam om op drukke dagen aan de hand van het gebruik van honderdduizenden mobiele telefoons te bepalen waar in de stad de mensenmassa gevaarlijk aangroeit. Er hoeft niet meer een heel leger waarnemers de straat op om poolshoogte te nemen.

Ook om de gewasgroei, zeg van tarwe, te achterhalen, is het in de nabije toekomst misschien niet meer nodig dat de onderzoeker het veld in gaat om metingen te doen. Via sensoren op de akker, maar ook van een drone of de satelliet krijgt hij gegevens binnen, niet van een paar onderzoeksplotjes maar van de hele akker of van meer regio’s tegelijk.

Drone.jpg

Voor dergelijke bergen gegevens draait de computer zijn hand niet om. Koppel daaraan de informatie over de hoeveelheid kunstmest, bodem, bespuitingen, neerslag en in een figuurlijke handomdraai is bekend hoe een bepaald tarweras het doet onder wisselende omstandigheden. Nu moeten onderzoekers daarvoor nog jarenlang deelaspecten onderzoeken. Uiteindelijk zal ook de boer profiteren als al die kennis kan worden vertaald naar handzame adviezen, bijvoorbeeld welk ras het best bij zijn situatie past.

De voordelen van big data voor duurzame landbouw

De FAO stelt dat het realiseren van een meer duurzame landbouw één van de grote uitdagingen is voor de wereldbevolking. Toepassingen van big data kunnen bijdragen aan een efficiëntere landbouw-voedsel (agro-food) keten en dus aan een duurzamere landbouw.

Lees meer over big data en duurzame landbouw

Watson, de zelflerende computer

Tijdens de dies natalis begin maart 2016 noemde rector magnificus Arthur Mol van Wageningen University & Research data-wetenschap ‘a new frontier’. Laxmi Parida, hoofd van de Computational Genomics Group van IBM Research in de Verenigde Staten legde bij die gelegenheid uit welke hulpmiddelen haar bedrijf al biedt. Bijvoorbeeld de zelflerende supercomputer Watson. Die kan razendsnel informatie verwerken, literatuur over de hele wereld doorzoeken (40 miljoen documenten in 15 seconden) maar ook verbanden leggen en informatie op waarde schatten dankzij geavanceerde kunstmatige intelligentie.

Om de kracht daarvan te laten zien, ontwikkelde IBM Watson Oncology, een hulpmiddel voor de behandeling van kankerpatiënten. Voor artsen, zeker buiten gespecialiseerde kankerziekenhuizen, wordt het steeds moeilijker om overzicht te houden over hun vakgebied en de uitdijende literatuur. Watson Oncology kan patiëntendossiers lezen en analyseren, bepalen welke diagnose het meest waarschijnlijk is op basis van literatuur, de mogelijke behandelingen aangeven, de bijwerkingen, maar dankzij informatie van sociale media ook aangeven hoe patiënten die behandeling ervaren. Een tiental Amerikaanse ziekenhuizen werkt er inmiddels mee.

‘Om computerprogramma’s te ontwikkelen die redeneren en leren complexe vraagstukken op te lossen, heb je gecombineerde kennis nodig van computerdeskundigen en vakspecialisten’, meent Perida. ‘Die twee partijen moeten voortdurend samenwerken om programma’s als Watson te ‘leren’ hoe die vraagstukken moet oplossen.’ Datawetenschap wordt een nieuwe wetenschappelijke discipline, verwacht zij, waarbij onderzoekers en bedrijven uit meerdere disciplines betrokken zijn. ‘Alles draait om context, context, context.’

- Helaas, uw cookie-instellingen zijn zodanig dat de video niet getoond kan worden - pas uw permissie voor cookies aan

Supercomputer in aardappelonderzoek

Richard Visser kan dat beamen. Hij is hoogleraar plantenveredeling bij Wageningen University & Research. Vorig jaar klopte hij aan bij IBM Research in New York om de supercomputer in te zetten voor de veredeling van aardappel. Eerst moet Watson leren zich te focussen. ‘Het is een peuter met een geweldige potentie, maar je moet hem wel eerst veel leren. Bij het woord ‘knol’ moet hij niet uitkomen bij de dahlia’, aldus Visser.

Na dat leerproces zal Watson Potato een waardevol hulpmiddel zijn, hoopt Visser. ‘Watson kan veel sneller zoeken dan wij, en in veel meer literatuur. Wij komen er ook wel achter dat een bepaald gen bovenin chromosoom 3 ligt, maar dan heb je het over een gebied met wel duizend genen. Dat is nog altijd onhandelbaar veel’, aldus Visser. ‘Watson kan verder graven; die duizend genen vergelijken met DNA bij andere planten, maar ook bij paddenstoelen, mossels of vogels om te zien wat er bekend is over wat die genen dáár doen. Dan beperk je de lijst waarschijnlijk tot vijf of tien kandidaatgenen, en naarmate de computer meer kennis vergaart, wordt het misschien wel meteen een schot in de roos.’

De computer leert van zijn fouten. Als hij van experts te horen krijgt dat de antwoorden in de goede richting wijzen, dan borduurt hij daarop voort. Bij negatieve feedback laat hij het gevolgde spoor rusten. ‘Hij leert dus echt, net als een mens en bouwt expertise op.’

De meerwaarde van Watson Potato, verwacht Visser, ligt vooral in het voortraject van de veredeling, bij betere selectie van ouders voor een nieuw ras. ‘We hebben het vaak over groene vingers, over breeders eyes, maar veredeling is uiteindelijk veel trial and error. Daar willen we vanaf. Door kennis over uiterlijke kenmerken, DNA samenstelling, opbrengst en groeiomstandigheden te koppelen, kunnen we veel beter ons uitgangsmateriaal kiezen.’ En op termijn zit er misschien meer in het vat, door Watson zijn tanden in complexe problemen te laten zetten. ‘Welke genen zijn er verantwoordelijk voor dat de ene aardappel hardkokend is en de andere afkookt? Daar hebben we eigenlijk nog geen idee van.’

Is alle gewenste data wel beschikbaar?

Om databestanden ook daadwerkelijk op die manier te kunnen benutten, dient de wetenschap de bakens te verzetten, denkt de EU. Resultaten van onderzoek worden lang niet altijd goed opgeslagen, wetenschappelijke tijdschriften bieden daar niet de ruimte voor of de bestanden zijn door verschillende formats niet goed toegankelijk of slecht te koppelen. De Europese Commissie kondigde daarom in april een miljardeninvestering aan in datamanagement door middel van de European Open Science Cloud. De komende tien jaar zijn een half miljoen data-experts nodig om de vruchten van wetenschappelijk onderzoek tot één digitaal geheel te smeden.

Het aan elkaar knopen van informatie staat of valt met data die vindbaar zijn. Daarmee is mijn toch al zeer bescheiden bijdrage aan de wetenschap definitief onbelangrijk geworden. Ik krabbelde mijn veld-waarnemingen nog op vaak nat geregende papiertjes. Inmiddels wordt de vindplaats van een zeldzame plant inclusief gps-coördinaten via een veldcomputer of de telefoon direct digitaal opgeslagen. De weerslag van mijn waarnemingen in doctoraalverslagen - om een duistere reden zijn die bewaard - liggen bovendien diep weggestopt in de bibliotheek in Wageningen, ver weg van de digitale wereld.

Dat kon ook niet anders. Slechts schoorvoetend kreeg die nieuwe ict-wereld vorm. De harde schijf van mijn eerste pc, die ik in de jaren tachtig kocht, was 10 MB. Het leek me schier onmogelijk dat die ooit vol zou raken. Bij het universiteitsblad, mijn eerste baan, maakte de computer inmiddels al wel contact met de buitenwereld. De kopij werd niet meer op een floppy gezet en door de eindredacteur naar de drukkerij gebracht, maar via een modem verzonden. Maar het zou nog tot midden jaren negentig duren voordat ik, inmiddels bij de Volkskrant, op één computer af en toe een uurtje het internet op mocht.

Maar ook toen was er geen garantie dat data voor altijd beschikbaar blijven. ‘Mijn promotiewerk is heel moeilijk te herhalen’, zegt Wilco Hazeleger, die in 1999 zijn PhD behaalde in Utrecht. ‘Ik gebuikte codes die werkten op een computer die niet meer bestaat. Dat is slecht voor de wetenschap. Mijn werk is daardoor niet meer te verifiëren.’

Datamanagement

Studenten van nu, vindt hij, moeten leren met data om te gaan. ‘In een ordner of lokaal op een computer zijn die gegevens verloren. Het is belangrijk om te zorgen dat data zijn terug te vinden, voorkomen dat een linkje na drie jaar dood is’, aldus Hazeleger. ‘In Europa hanteren we sinds dit voorjaar het FAIR-principe: data moeten findable, accessable, interoperable en reusable zijn: vindbaar, toegankelijk, met elkaar te verbinden en te hergebruiken. Dat principe is mede onderschreven door Wageningen University & Research.’

Sander Janssen, open/big data specialist, van Wageningen Environmental Research (Alterra) juicht FAIR van harte toe. Net zoals de groeiende aandacht voor datamanagement. Om gegevens te redden van de vergetelheid richtte hij eind vorig jaar, met steun van een aantal grote wetschappelijke landbouwkundige instellingen, een elektronisch tijdschrift op: het Open Data Journal for Agricultural Research. ‘Daarin staan de data-sets zelf, een omschrijving waarvoor ze te gebruiken zijn en hoe die informatie is verzameld’, legt Janssen uit. ‘Het leek mij een goed idee om data te publiceren, net zoals dat gebeurt met wetenschappelijke artikelen. Langzaamaan wint die gedachte terrein.’

Verbinding en nieuwe ideeën dankzij toegankelijke data

Samen met anderen bouwde Janssen tijdens zijn promotie-onderzoek een database over de Europese landbouw. ‘Toen wij in 2009 daarover ons eerste data paper publiceerden, had daar nog niemand belangstelling voor. Data, ach, dat hoorde er bij, net zoals een dokter een stethoscoop heeft, maar in de wetenschap ligt de focus op analyse. Dáár publiceer je over. Dat vind ik wat te kortzichtig. In data schuilt unieke waarde; ook andere mensen kunnen er bijvoorbeeld mee aan de slag.’

Net als Hazeleger verwacht hij dat uitwisseling van onderzoeksgegevens wetenschappers uit verschillende vakgebieden kan verbinden. ‘Moet ik een probleem oplossen waar meerdere vakgebieden bij betrokken zijn, dan ben ik nu nog aangewezen op de goodwill en tijd van professoren in andere disciplines. En die hebben het natuurlijk heel druk. Dat remt af, of het probleem wordt daardoor maar helemaal terzijde geschoven. Als ik de benodigde data zelf kan binnenhalen en gebruiken, dan geeft dat nieuwe mogelijkheden.’

Bovendien stimuleert dat de creativiteit, denkt Janssen. ‘Vorig jaar hebben we mensen uit de bosbouw, remote sensing en klimaatverandering bij elkaar gezet in een kamer en voorzien van data uit verschillende disciplines. Daardoor kwamen ze op nieuwe ideeën. Data boden inspiratie om over de domeingrenzen heen te kijken. Of dat big data is? Voor mijn gevoel gaat het niet om groot, maar om de koppeling over domeinen heen die uiteindelijk leidt tot ‘small data’: informatie die relevant is voor een gebruiker. Dat is mijn drijfveer om met datamanagement bezig te zijn, individuen toegang geven tot informatie.

Bijvoorbeeld om boeren in Afrika te ondersteunen. ‘Het is daar nu nog data-arm. Er zijn bijvoorbeeld nog maar heel weinig meteostations, maar ook daar zal het genereren van data snel toenemen’, verwacht Janssen. De opmars van de smartphone maakt het mogelijk nuttige informatie, bijvoorbeeld over het weer of een geschikt moment om te zaaien, bij boeren te krijgen. ‘Toegang tot informatie en ict zijn cruciaal om die gebieden verder te brengen.’

Big data voor een betere voedsel- en veiligheidsstatus in Afrika

Door het combineren van big data gegevens zoals weermodellen, marktinformatie en gewasmonitoring kunnen we een ondersteunend netwerk beschikbaar stellen aan kleine boeren in Ethiopië. Hierdoor zijn zij beter in staat hun voedsel- en veiligheidsstatus te verbeteren.

Lees meer over het CommonSense project

Zijn collega Karin Andeweg vult aan met een voorbeeld. ‘Ethiopische boeren hebben veel moeite om een banklening te krijgen omdat ze niet kunnen aantonen hoeveel kapitaal ze hebben. Kapitaal zit in koeien, die lopen ergens ver weg en ze weten, iets gechargeerd, eigenlijk niet eens zeker of ze nog wel in leven zijn. Een bedrijfje is nu bezig met kleine, goedkope chips die de positie van de dieren vastlegt maar ook hun hartslag en temperatuur meet. Met zo’n chip kan de boer aan de bank bewijzen dat hij levende koeien heeft. Bovendien biedt het de mogelijkheid om de gezondheidstoestand van het vee in de gaten houden. Op termijn kun je dat misschien wel combineren met satellietbeelden van de vegetatie om te controleren of er nog voldoende voedsel is in het gebied waar de dieren grazen.’

Open data: gegevens moeten voor iedereen toegankelijk zijn

Daarvoor is het nodig dat die satellietbeelden toegankelijk zijn, benadrukt Janssen. Hij loopt niet alleen warm voor small data maar ook voor ‘open data’. ‘De meeste voordelen van big data komen nu nog uit de marketing, van bedrijven die toegang hebben tot enorme databestanden. Bijvoorbeeld Amazone of Google. Die kunnen persoonlijke voorkeuren die ze van je kennen verbinden. In de landbouw en de gezondheidszorg ligt dat ingewikkelder. Er is niet één instantie die alle data in handen heeft.’

Wie mag bijvoorbeeld aanspraak maken op gegevens over de koe? De eigenaar van de melkmachine die metingen doet, het bedrijf of het instituut dat de informatie kan interpreteren, of toch de boer zelf? En van wie zijn de resultaten als een bedrijf en een universiteit hun datasets combineren? Dat is nog nagenoeg onontgonnen gebied.

melken_automaat.jpg

Tijdens een symposium ter gelegenheid van de dies van Wageningen University in maart 2016 bleek dat verschillende partijen hun eigen data afschermen uit angst dat een ander er met de kip met de gouden eieren vandoor gaat. Toch biedt samenwerking meerwaarde, leert de historie. Om koeien naar de VS te kunnen verkopen en betere fokresultaten te boeken, stapten melkveehouders eind 19de eeuw over hun eigen schaduw heen. Ze deelden gegevens over de melkgift van hun koeien via het stamboek, zodat ze er samen beter van werden.

Volgens Ben Schaap is innovatie ermee gediend als databestanden toegankelijk zijn voor iedereen. Schaap is door Wageningen University & Research gedetacheerd bij Global Open Data for Agriculture and Nutrition (GODAN), een mondiale lobby-organisatie voor open data in de landbouw- en voedingssector. Sponsors zijn onder meer de VS, Groot-Brittannië, Nederland en de FAO, en onder de vierhonderd partners zijn bedrijven als IBM en Syngenta maar ook lokale Afrikaanse ngo’s. ‘Openheid zorgt voor een gelijkwaardig speelveld voor iedereen’, zegt Schaap. ‘Als gegevens niet toegankelijk zijn, hebben partijen met meer macht en geld de grootste controle. Een multinational kan informatie kopen, een eenmansbedrijfje kan daar niet tegenop.’

De wereldvoedselvoorziening is te belangrijk, vindt GODAN, om over te laten aan partijen met veel geld. Ook een arme boer in Afrika moet bijvoorbeeld kunnen profiteren van adviezen via applicaties op de smartphone. ‘Open data zorgt ervoor dat er meer partijen applicaties kunnen ontwikkelen en de boer niet afhankelijk is van één partij die bijvoorbeeld ook zaaizaad, meststoffen of gewasbeschermingsmiddelen levert.’ Als de informatie van weerstations of satellieten openbaar is, kan iedereen ermee aan de slag. Niet alleen een multinational maar ook een slimme whizzkid. Daarom is het erg belangrijk dat publiek gefinancierde gegevens openbaar zijn zonder voorwaarden vooraf, vindt Schaap. ‘Daar horen ook de datasets bij die universiteiten en instituten verzamelen en publiceren. Dat bedrijven waarschijnlijk minder happig zijn door hen verzamelde gegevens door anderen te laten gebruiken, begrijpt Schaap. ‘Toch zijn er ook bedrijven die bereid zijn een open-data-landschap te creëren. Innoveren kan tegenwoordig niet meer alleen, is hun gedachte. Open science zorgt voor samenwerking met slimme uitvinders.’

Open Science in Wageningen

De overgang naar open wetenschap is onvermijdelijk. Hoe kunnen we daar bij Wageningen University & Research nu en in de toekomst het beste mee om gaan?

Praat mee in ons OpenScience blog (EN)

Veranderingen in onderwijs en wetenschap

Nationaal voortrekker big data, Wilco Hazeleger, verwacht dat wetenschap meer en meer data-gedreven zal worden. ‘Het is echter geen heilige graal. Geef ons big data en we hebben antwoorden op alle vragen, zo is het niet.’ Maar als je data analyseert of data combineert kun je wel verrassingen tegenkomen en nieuwe hypotheses ontwikkelen, zonder dat je daarvoor eerst een theorie hoeft af te leiden. Dit luidt de terugkeer in van de empirische wetenschap.’

Zou ik ook met dat vooruitzicht weer biologie zijn gaan studeren? De opleiding is in veertig jaar ingrijpend veranderd. Wat ik heet van de naald leerde, is inmiddels volkomen oude koek; de kaartenbakken in de bibliotheek, later de microfiches, zijn verdwenen. Dankzij ict is de hele wereld permanent onder handbereik, ook in een stadje aan de rand van de Veluwe.

Maar de mensen die er komen studeren zijn niet wezenlijk anders dan veertig jaar geleden is mijn indruk. Nog altijd zijn de meeste Wageningers gefascineerd door natuur. Maar is dat in deze tijd nog wel een pre? Komen jonge onderzoekers nog ooit buiten of zitten ze vooral achter de computer databestanden te koppelen? En kunnen ze dat bij IBM eigenlijk niet allang veel beter?

Half gekscherend liet Rory Collins, hoogleraar geneeskunde en epidemiologie in Oxford, zich tijdens een congres in Groot-Brittannië ontvallen dat je voor een carrière in de geneeskunde eigenlijk beter wiskunde of informatica kan gaan studeren. Over the top, vinden ze in Wageningen ‘Het is essentieel om techniek en vakkennis bij elkaar te brengen’, denkt Sander Janssen. ‘Domeinkennis is onontbeerlijk; je kunt niet van Wikipedia leren hoe een plant groeit.’

plant breeding .jpg

Ook Hazeleger aarzelt niet. ‘Studenten van nu moeten natuurlijk met grote data-sets om kunnen gaan, maar ze moeten vooral ook naar buiten om biologie te studeren. Inhoudelijke kennis is en blijft fundamenteel. Doordat wat jij weet van biologie, herken je dingen in de data die anderen niet zien.’