Het Open Science-verhaal van Justin van der Hooft
In de serie Open Science-verhalen vertellen WUR-onderzoekers en docenten hoe zij bijdragen aan Open Science & Education bij WUR. De eerste in de serie is Dr Justin van der Hooft, universitair docent Computational Metabolomics bij de Bioinformatics-groep.
Wat is je grootste prestatie op het gebied van open wetenschap?
Samen met onderzoekers van het Netherlands eScienceCenter (Amsterdam) en de University of California San Diego (VS) heeft mijn team het Paired Omics Data Platform (PoDP) ontwikkeld. Dit platform brengt twee datatypes, genomische en metabolomische, samen in zowel een menselijk als een voor de computer leesbaar platform. Het platform zorgt voor interoperabiliteit van gegevens en is gebaseerd op FAIR-dataprincipes. Dit maakt het gemakkelijker om nieuwe algoritmen te ontwikkelen die automatisch genclusters en metabolietspectra koppelen, waardoor we spectra van voorheen onbekende bioactieve (antibiotische) metabolieten kunnen koppelen aan de genetische machinerie die ze produceert. Het is een perfect voorbeeld van community-gedreven Open Science. Veel laboratoria uit verschillende landen hebben al gegevens gedeeld op het platform.
Hoe motiveer je onderzoekers om hun gegevens te delen?
Het belang van het delen van onderzoeksdata wordt overal onderschreven, maar in de praktijk lopen onderzoekers tegen verschillende barrières aan. Gegevens delen is dus nog niet zo mainstream als ik zou willen. Een van de barrières is tijd. Je moet het mensen zo makkelijk mogelijk maken om hun onderzoeksgegevens te delen. Bij het PoDP hebben we het aantal vereiste metadata beperkt om de tijdsinvestering beheersbaar te houden.
Soms zijn mensen huiverig om gegevens te delen omdat ze bang zijn dat anderen er met de gegevens vandoor gaan en hen "wegkapen". Hoewel ik deze zorg serieus neem, is de kans dat een andere groep jouw hele onderzoek binnen een paar maanden of jaren kan herhalen over het algemeen erg klein, omdat ze niet dezelfde biochemische expertise hebben als jij.
We moeten ons er echter wel van bewust zijn dat de de carrièrefase waarin je je bevindt van invloed kan zijn op je inzet. Ik kan me voorstellen dat promovendi en beginnende onderzoekers, vooral in disciplines met een hoge publicatiedruk, niet staan te springen om hun gegevens te delen tijdens hun studie. Het zou helpen als tijdschriften zouden afspreken dat als iemand met een onderzoek komt op basis van jouw gegevens terwijl jouw paper wordt beoordeeld, jouw ingediende publicatie nog steeds als nieuw en origineel wordt beschouwd. Dan heeft een "primeur" van andere onderzoekers met jouw gegevens veel minder impact: in plaats daarvan kun je het zien als een teken dat jouw gegevens waardevol zijn en tot nieuwe inzichten leiden.
Wat zijn de voordelen van het delen van data?
Er zijn veel bekende voordelen. Door je gegevens te delen, kan er meer onderzoek worden gedaan met dezelfde gegevens, kan onderzoek worden herhaald en kunnen onderzoeken gemakkelijker worden vergeleken. Voor onderzoeksgroepen zoals de mijne is het cruciaal dat mensen hun gegevens delen; we hebben de gegevens nodig om onze tools te verbeteren en te optimaliseren, wat een voordeel is voor de degenen die de gegevens genereren en die ook de eindgebruikers zijn van onze tools.
Ik denk dat we sterker de nadruk moeten leggen op de persoonlijke voordelen van het delen van gegevens, zoals het feit dat fouten er gemakkelijker uitgefilterd kunnen worden en dat je onderzoeksgegevens in een repository ook voor de lange termijn bewaard blijven, zodat je er altijd toegang toe hebt.
Wat kan WUR doen om onderzoekers aan te moedigen?
Dit is waar het programma voor Erkennen en Waarderen om de hoek komt kijken.
Het leveren van herbruikbare en toegankelijke databestanden of het bouwen van de tools daarvoor zou formeel gewaardeerd moeten worden, gezien de inspanningen die hierin gaan zitten als je het goed wilt doen. Dit is vooral het geval als deze activiteiten successen opleveren, zoals publicaties of nieuw onderzoek door derden.
Als je drie wetenschappers (levend of dood) kon uitnodigen voor een diner om over Open Science te praten, wie zou je dan uitnodigen en waarom?
Het zou geweldig zijn om Charles Darwin en Marie Curie te ontmoeten en hen te vertellen over de Open Science-beweging! Ik denk dat ze erg verrast en enthousiast zouden zijn. Eigenlijk zou ik zelf heel graag terug willen gaan in de tijd om erachter te komen hoe zij destijds hun kennis deelden. Zou het mogelijk zijn om überhaupt iets te doen met Open Science? Welke impact zou het gehad kunnen hebben? Natuurlijk zullen we daar nooit achter komen, maar gezien de reizen die Darwin maakte, zouden er ongelooflijke datasets uit voortgekomen kunnen zijn!
Op dit moment zou ik Pieter Dorrestein uitnodigen van de Universiteit van Californië, San Diego. Ik werk intensief met hem en zijn team samen. Zijn Global Natural Products Social Molecular Networking (GNPS) platform is iets wat iedereen kan gebruiken. Als zodanig is hij een groot rolmodel voor mij. Ik wil graag met hem bespreken hoe we kunnen overstappen op nog betere databeschrijvingen om hergebruik van data mogelijk te maken en te bevorderen. Hoe kunnen we het onderzoekers makkelijk maken om hun data te deponeren, maar ook zorgen voor goed gecureerde metadata en betrouwbare annotaties?
Waar kan WUR zich op richten om het makkelijker te maken?
Er zijn al veel hulpmiddelen en sjablonen beschikbaar voor de gebruikers. Het zou goed zijn om meer discipline-specifieke tutorials te hebben, zodat groepen sneller FAIR-gegevens kunnen registreren en aan de eisen van financiers kunnen voldoen.
Naar mijn mening hangt het succes van Open Science uiteindelijk af van zowel de intrinsieke motivatie als de passende beloning van onderzoekers. We moeten de voordelen blijven benadrukken, zowel voor de wetenschappelijke gemeenschap als voor individuele onderzoekers.