Onderzoekers

Datamanagement

Datamanagement is het opslaan, delen, archiveren en vinden van gegevens rondom onderzoek.

Waarom datamanagement?

In de beginfase van je onderzoek kun je met een informatiespecialist/datasteward kijken naar:

  • Hoeveel data genereer ik tijdens mijn onderzoek?
  • Welk soort data zijn het en in welk formaat sla ik het op?
  • Hoe kan ik (en anderen) mijn data het beste terugvinden?
  • Hoe kan ik gemakkelijk en veilig data delen met medeonderzoekers?
  • Welke data repositories zijn van belang voor je vakgebied?
  • Het opstellen van een datamanagementplan.

Als knooppunt in het proces verbindt de informatiespecialist/datasteward je ook met ICT en informeert je over beleid en wet- en regelgeving waarmee je rekening dient te houden bij datamanagement.

Het goed managen van je onderzoeksdata is belangrijk:

  • Het zijn eisen van financiers en instellingen.
  • Je handelt volgens de Nederlandse Gedragscode voor Wetenschappelijke Integriteit.
  • Je kunt je data later terugvinden.
  • Je merkt vroegtijdig welke voorzieningen je nodig hebt om je data veilig op te slaan.
  • Je kunt de controleerbaarheid en integriteit van het onderzoek waarborgen.
  • Je kunt je datasets publiceren  voor toekomstig hergebruik.
  • Onderzoeksdata kunnen extra impact generereren bij publicatie.

Enkele informatiespecialisten/datastewards maken deel uit van de pool of experts van het Landelijke Coördinatiepunt Research Data Management (LCRDM).

Hulp nodig bij het beantwoorden van vragen rond datamanagement of begeleiding bij het invullen van je datamanagementplan (DMP)? Mail dan naar een van de informatiespecialisten/datastewards van je kenniscentrum:

Kenniscentrum Leren en Innoveren:

Kenniscentrum Gezond en Duurzaam Leven:

Kenniscentrum Sociale Innovatie:

Kenniscentrum Economisch Sterke en Creatieve Stad:

Voorafgaand aan het onderzoek

Datamanagementplan
Voor je begint met je onderzoek is goed om na te denken over hoe je om wil gaan met je onderzoeksdata. Subsidieverstrekkers als NWO en ZonMW vragen bij de subsidieaanvraag al een datamanagementparagraaf.

De datamanagementparagraaf werk je later, samen met een informatiespecialist uit tot een datamanagementplan. Dat helpt je om bewuste en consistente beslissingen te nemen over je onderzoeksdata. In een latere fase van het onderzoek kan dit tijd besparen. Bovendien vragen steeds meer subsidieverstrekkers om zo’n plan.

Door het opstellen van een datamanagementplan (DMP) schep je als onderzoeker de voorwaarden voor goed datamanagement. In een DMP beschrijf je welke data je tijdens het onderzoek gaat verzamelen, hoe je deze data tijdens het onderzoek bewaart en wat er met de data na afloop van het onderzoeksproject gebeurt. Tijdens het opstellen van een datamanagementplan besteed je aandacht aan alle aspecten die te maken hebben met het beheer van de onderzoeksdata. Door dit in een vroeg stadium te doen, verklein je de kans op verrassingen.

In een datamanagementplan beantwoord je vragen als:

  • Welke data ga je verzamelen? Wat voor type data of welke bestandsformaten en wat kan de omvang worden van deze data?
  • Waar en hoe ga je deze data opslaan? Hoe zorg je voor back-ups?
  • Hoe ga je je data organiseren en beschrijven?
  • Wie krijgt toegang tot die data en hoe beheer je die toegang?
  • Wat wordt na afloop van het project gearchiveerd? Waar en voor hoe lang?
  • Komen de gearchiveerde data beschikbaar voor anderen?
  • Wie is de eigenaar van je data en wie is verantwoordelijk voor het beheer?
  • (Hoe) is voorzien in de middelen die nodig zijn om het allemaal uit te voeren?

Een datamanagementplan is een levend document. Het is mogelijk dat je bepaalde vragen in eerste instantie niet of alleen op hoofdlijnen kunt beantwoorden. Ook kan het in de praktijk nodig blijken om zaken anders te regelen dan je aanvankelijk van plan was. Je kunt je plan altijd aanvullen of wijzigen.

Je kunt templates voor een datamanagementplan vinden bij DMP-online. Bijvoorbeeld het template van NWO of ZonMWw (zoek via Funder Requirements). Ook kun je voorbeelden van ingevulde datamanagementplannen inzien via DMP-online.

Promovendi
Doe je promotieonderzoek dan maak je van tevoren goede afspraken waar je de onderzoeksdata gaat opslaan. Doe je dat bij Hogeschool Utrecht of bij de universiteit waar je voor je promotieonderzoek aan bent verbonden? Sla je de onderzoeksdata bij de universiteit op, dan leg je ook daarvan de gemaakte afspraken vast. Dit is belangrijk voor veiligheid en continuiteit.

Software voor onderzoekers
Tijdens je onderzoek ga je veel data verzamelen en heb je misschien specifieke wensen over ICT faciliteiten. Samen met een informatiespecialist/datasteward kan je je verzoeken inventariseren en doorgeven aan HU ICT over:

  • Meer rechten op laptop/desktop verkrijgen
  • Aanvragen veilige opslagruimte op HU onderzoekschijf
  • Aanvragen van nieuwe software voor onderzoek

Tijdens het onderzoek

In het datamanagementplan beschrijf je hoe je de onderzoeksdata wilt opslaan. Ook waarborg je de veiligheid van de data en plan je hoe je onderzoeksdata kunt uitwisselen met medeonderzoekers.

Anonimiseren en pseudonimiseren
Data, die persoonlijke gegevens bevatten, dienen te voldoen aan de Algemene Verordening Gegevensbescherming (AVG). Om de rechten en vrijheden van betrokkenen in onderzoek te beschermen is het noodzakelijk om gegevens te anonimiseren of pseudonimiseren. Het weghalen van namen of identificerende nummers (Burgerservicenummer, Strafrechtsketennummer, studienummer et cetera) is niet voldoende om tot anonieme data te komen. Anonimiseren moet per definitie onomkeerbaar zijn. Als je tot de geïdentificeerde betrokkenen terug zou kunnen komen dan zijn de gegevens niet anoniem.
Onder de AVG moet gekeken worden naar herleidbaarheid van data en moet een onderzoeker zich de volgende vragen stellen:

  • Kan ik, een ander of een organisatie, individuele participanten nog uit de totale groep (mogelijke) respondenten halen zonder hun naam te kennen (singling out)?
  • Kan ik nog data uit andere bronnen koppelen aan de data over deze betrokkene? Ook als je besluit de data niet te koppelen; als het zou kunnen dan is dit relevant.
  • Is het mogelijk om uit de beschikbare data over een betrokkene andere data af te leiden? Ook hier geldt dat niet de vraag is of je dat als onderzoeker wilt doen maar of het zou kunnen.

Kun je tenminste één van deze vragen met “ja” beantwoorden, dan zijn de gegevens niet anoniem maar pseudoniem.
Dit betekent dus ook dat in al het onderzoek waarbij gebruik gemaakt wordt van een uniek identificerend nummer voor een respondent, er sprake is van pseudonieme gegevens en dat de eisen die de AVG stelt aan verwerking van deze gegevens gelden. Echt anonimiseren is erg lastig maar pseudonimiseren van gegevens is wel een waardevolle eerste stap om de persoonsgegevens van je respondenten te beveiligen.

Data opslag en veilig delen

Opslaan van je eigen onderzoeksdata:
Onderzoeksdata voor eigen gebruik worden opgeslagen op het HU netwerk. Er is een plaats speciaal ingericht voor HU onderzoek: de Onderzoeksschijf. Hier wordt voor per lectoraat, met de daarbij behorende onderzoeksprojecten, opslagcapaciteit beschikbaar gemaakt. Ook de langdurige opslag is (voorlopig) op deze plek geregeld. Werk je buiten de HU, dan is deze opslagruimte bereikbaar via een VPN verbinding.

Externe harde schijven, USB sticks, Dropbox etc. worden niet gebruikt om HU onderzoeksdata op te slaan. Deze opslagmedia zijn niet veilig.

Veilig delen met anderen:
Voor het veilig delen van data met andere instellingen is SURFdrive beschikbaar. Als je samenwerkt met andere Nederlandse onderwijsinstellingen dan is SURFdrive erg geschikt om bestanden veilig te delen.
Je kunt het vergelijken met een veilige versie van Dropbox of Google Drive.
Via openbare links kun je ook mappen delen met externen. Je bepaalt zelf de rechten van met wie je deelt.

Grote bestanden (versleuteld) versturen:
Incidenteel grote bestanden versturen doe je met SURFfilesender. Je kunt het vergelijken met een veilige versie van WeTransfer.  Je kunt de bestanden versleuteld versturen met een wachtwoord volgens de Advanced Encryption Standard met een 256 bits sleutel.
Het bestand wordt dan in versleutelde vorm op een veilige server opgeslagen. Vervolgens mail of app je de ontvanger het wachtwoord. De ontvanger, voert het wachtwoord in en ontvangt dan het bestand, dat pas bij ontvangst weer leesbaar wordt.
Op deze manier kun je dus op een verantwoorde manier gevoelige (video)data delen met bijvoorbeeld studenten. Maak wel de afspraak dat deze na gebruik de ontsleutelde bestanden weer van hun eigen computers wissen.

Handmatig bestanden versleutelen (encryptie):
Wil je handmatig bestanden versleutelen (encryptie) met je HU laptop dan kan dat met 7-ZIP. Deze tool kun je via het HU Software Center downloaden.
Bovendien comprimeer je ook nog eens je data, zodat het minder ruimte inneemt. Stel voor maximale veiligheid de encryptie in op Advanced Encryption Standard 256 bits (AES-256).

Bestandsformaten
Als bewijsvoering voor je onderzoek dienen de onderzoeksdata gedurende een wettelijk bepaalde termijn bewaard te blijven (tenminste 10 jaar) en toegankelijk voor derden te zijn.
Ieder bestandsformaat loopt het risico om verouderd te raken. Als een formaat veroudert, wil dat zeggen dat men met de huidige software niet meer in staat is om de inhoud van het bestand te gebruiken of weer te geven zoals bedoeld toen het bestand werd gemaakt. Om veroudering voor te zijn, kan een aantal voorzorgsmaatregelen worden genomen. Een van die maatregelen is om bestandsformaten te gebruiken die een hoge kans hebben om vele jaren bruikbaar te blijven.

De organisatie Data Archiving and Networked Services (DANS) heeft als richtlijn dat bestandsformaten die het beste geschikt zijn voor duurzaamheid en toegankelijkheid op de lange termijn:

  • Veel worden gebruikt
  • Open specificaties hebben
  • Onafhankelijk zijn van specifieke software, ontwikkelaars of leveranciers,

Voor het duurzaam bewaren van data heeft DANS een lijst van voorkeursbestandsformaten opgesteld, waarvan verwacht mag worden dat deze formaten langdurig leesbaar blijven danwel omgezet kunnen worden naar nieuwere formaten.

Na het onderzoek

Onderzoeksdata dienen veilig en duurzaam te worden opgeslagen zodat zij als bewijsmateriaal kunnen dienen voor de publicatie en mogelijk ook gebruikt kunnen worden voor verder onderzoek. Het gaat dus om data archivering en hergebruik.
Subsidieverstrekkers kunnen vragen om dit in datamanagementparagraaf al ver van tevoren vast te leggen.

Van belang is om goed te regelen wie er toegang krijgt tot de data. Ook is belangrijk te bepalen voor welke termijn de data minimaal opgeslagen dienen te worden.
In Nederland zijn er twee instituten die dataopslag verzorgen: DANS en voor technisch wetenschappelijk onderzoek, 4TU.ResearchData.

Je kunt als onderzoeker je datasets (gratis tot 50GB) voor de lange termijn opslaan in EASY van DANS.
Log de eerste keer in met je instelling (HU) en maak dan je persoonlijke EASY account aan. Dan is je account gekoppeld aan de HU.

Doe je technisch wetenschappelijk onderzoek, dan kun je je datasets bij 4TU.ResearchData archiveren. Tot 10GB per jaar uploaden is gratis. Bij meer data betaal je per Gigabyte. De HU heeft nog geen instellingsaccount bij 4TU.ResearchData. Maar je kunt via het uploadformulier een persoonlijk account aanmaken.

Wettelijke kaders omgang met onderzoeksdata

Een van de aandachtspunten binnen het project is privacy. Prof. dr. Ellen Gerrits, lector logopedie: participatie door communicatie, vertelt in dit filmpje over de Wet Medisch Wetenschappelijk Onderzoek (WMO) en de Medisch Ethische Screeningscommissie binnen het gezondheidsdomein van de HU. Wat kunnen we ethisch gezien van proefpersonen vragen en hoe leggen we deze data zo vast dat ze niet te traceren zijn naar de individuele mensen?

Met welke wet- en regelgeving en afspraken dienen onderzoekers en studenten die betrokken zijn bij onderzoek rekening te houden bij het verzamelen, opslaan, delen en archiveren van onderzoeksdata?

Switch to English English
× App de balie