Onderzoekers

Datamanagement

Datamanagement is het opslaan, delen, archiveren en vinden van gegevens rondom onderzoek.

Voorbereiden van onderzoek: Datamanagement, waarom?

In de beginfase van je onderzoek kun je met een informatiespecialist/datasteward kijken naar:

  • Hoeveel data genereer ik tijdens mijn onderzoek?
  • Welk soort data zijn het en in welk formaat sla ik het op?
  • Hoe kan ik (en anderen) mijn data het beste terugvinden?
  • Hoe kan ik gemakkelijk en veilig data delen met medeonderzoekers?
  • Welke data repositories zijn van belang voor je vakgebied?
  • Het opstellen van een datamanagementplan.

Als knooppunt in het proces verbindt de informatiespecialist/datasteward je ook met ICT en informeert je over beleid en wet- en regelgeving waarmee je rekening dient te houden bij datamanagement.

Het goed managen van je onderzoeksdata is belangrijk:

  • Het zijn eisen van financiers en instellingen.
  • Je handelt volgens de Nederlandse Gedragscode voor Wetenschappelijke Integriteit.
  • Je kunt je data later terugvinden.
  • Je merkt vroegtijdig welke voorzieningen je nodig hebt om je data veilig op te slaan.
  • Je kunt de controleerbaarheid en integriteit van het onderzoek waarborgen.
  • Je kunt je datasets publiceren  voor toekomstig hergebruik.
  • Onderzoeksdata kunnen extra impact generereren bij publicatie.

Enkele informatiespecialisten/datastewards maken deel uit van de pool of experts van het Landelijke Coördinatiepunt Research Data Management (LCRDM).

Hulp nodig bij het beantwoorden van vragen rond datamanagement of begeleiding bij het invullen van je datamanagementplan (DMP)? Mail dan naar een van de informatiespecialisten/datastewards van je kenniscentrum.

Voorbereiden van onderzoek: Datamanagementplan

Voor je begint met je onderzoek is goed om na te denken over hoe je om wil gaan met je onderzoeksdata. Subsidieverstrekkers als NWO en ZonMW vragen bij de subsidieaanvraag al een datamanagementparagraaf.

De datamanagementparagraaf werk je later, samen met een informatiespecialist uit tot een datamanagementplan. Dat helpt je om bewuste en consistente beslissingen te nemen over je onderzoeksdata. In een latere fase van het onderzoek kan dit tijd besparen. Bovendien vragen steeds meer subsidieverstrekkers om zo’n plan.

Door het opstellen van een datamanagementplan (DMP) schep je als onderzoeker de voorwaarden voor goed datamanagement. In een DMP beschrijf je welke data je tijdens het onderzoek gaat verzamelen, hoe je deze data tijdens het onderzoek bewaart en wat er met de data na afloop van het onderzoeksproject gebeurt. Tijdens het opstellen van een datamanagementplan besteed je aandacht aan alle aspecten die te maken hebben met het beheer van de onderzoeksdata. Door dit in een vroeg stadium te doen, verklein je de kans op verrassingen.

In een datamanagementplan beantwoord je vragen als:

  • Welke data ga je verzamelen? Wat voor type data of welke bestandsformaten en wat kan de omvang worden van deze data?
  • Waar en hoe ga je deze data opslaan? Hoe zorg je voor back-ups?
  • Hoe ga je je data organiseren en beschrijven?
  • Wie krijgt toegang tot die data en hoe beheer je die toegang?
  • Wat wordt na afloop van het project gearchiveerd? Waar en voor hoe lang?
  • Komen de gearchiveerde data beschikbaar voor anderen?
  • Wie is de eigenaar van je data en wie is verantwoordelijk voor het beheer?
  • (Hoe) is voorzien in de middelen die nodig zijn om het allemaal uit te voeren?

Een datamanagementplan is een levend document. Het is mogelijk dat je bepaalde vragen in eerste instantie niet of alleen op hoofdlijnen kunt beantwoorden. Ook kan het in de praktijk nodig blijken om zaken anders te regelen dan je aanvankelijk van plan was. Je kunt je plan altijd aanvullen of wijzigen.

Je kunt templates voor een datamanagementplan vinden bij DMP-online. Bijvoorbeeld het template van NWO of ZonMWw (zoek via Funder Requirements). Ook kun je voorbeelden van ingevulde datamanagementplannen inzien via DMP-online.

Promovendi
Doe je promotieonderzoek dan maak je van tevoren goede afspraken waar je de onderzoeksdata gaat opslaan. Doe je dat bij Hogeschool Utrecht of bij de universiteit waar je voor je promotieonderzoek aan bent verbonden? Sla je de onderzoeksdata bij de universiteit op, dan leg je ook daarvan de gemaakte afspraken vast. Dit is belangrijk voor veiligheid en continuiteit.

Software voor onderzoekers
Tijdens je onderzoek ga je veel data verzamelen en heb je misschien specifieke wensen over ICT faciliteiten. Samen met een informatiespecialist/datasteward kan je je verzoeken inventariseren en doorgeven aan HU ICT over:

  • Meer rechten op laptop/desktop verkrijgen
  • Aanvragen veilige opslagruimte op HU onderzoekschijf
  • Aanvragen van nieuwe software voor onderzoek

Voorbereiden van onderzoek: Privacy

AVG
Sinds mei 2018 is de Algemene Verordening Gegevensbescherming (AVG) van toepassing De AVG beschrijft algemene principes die geborgd dienen te worden om de privacy te beschermen bij de verwerking van persoonsgegevens, ook als het gaat om persoonsgegevens in onderzoek. Er zijn veel soorten persoonsgegevens, zoals naam, adres, woonplaats en IP-adres. Gevoelige gegevens als iemands etnische afkomst, godsdienst of gezondheid worden bijzondere persoonsgegevens genoemd en zijn extra beschermd.

Je mag alleen persoonsgegevens verzamelen die noodzakelijk zijn om het onderzoeksdoel te bereiken en wanneer er een legitieme grondslag voor is. Informeer de privacy officer van je kenniscentrum of instituut wanneer je persoonsgegevens verzamelt/gaat verzamelen en laat je onderzoek opnemen in het verwerkingsregister.

Bekijk van te voren, eventueel samen met de privacy officer, of de voorgenomen verzameling en analyse een verhoogd risico voor de rechten van de betrokkenen met zich meebrengt. Als dit het geval is, moet de voorgenomen verwerking onderworpen worden aan een privacy impact assessment (PIA) (AVG spreekt van een Data Protection Impact Assessment (DPIA). Hier kan de privacy officer mee helpen. Wanneer de privacy officer niet beschikbaar is, kun je vragen stellen via askprivacy@hu.nl.

Gebruik een informed consent als je met respondenten werkt. In de handreiking toestemming bij onderzoek kun je hier informatie over vinden.

Als een andere organisatie de persoonsgegevens verwerkt en/of analyseert, moet er een verwerkersovereenkomst worden opgesteld en ondertekend. Bij voorkeur is dit ons eigen format. Neem contact op met inkoop@hu.nl als er een verwerkersovereenkomst nodig is.

Anonimiseren en pseudonimiseren
Data, die persoonlijke gegevens bevatten, dienen te voldoen aan de Algemene Verordening Gegevensbescherming (AVG). Om de rechten en vrijheden van betrokkenen in onderzoek te beschermen is het noodzakelijk om gegevens te anonimiseren of pseudonimiseren. Het weghalen van namen of identificerende nummers (Burgerservicenummer, Strafrechtsketennummer, studienummer et cetera) is niet voldoende om tot anonieme data te komen. Anonimiseren moet per definitie onomkeerbaar zijn. Als je tot de geïdentificeerde betrokkenen terug zou kunnen komen dan zijn de gegevens niet anoniem.
Onder de AVG moet gekeken worden naar herleidbaarheid van data en moet een onderzoeker zich de volgende vragen stellen:

  • Kan ik, een ander of een organisatie, individuele participanten nog uit de totale groep (mogelijke) respondenten halen zonder hun naam te kennen (singling out)?
  • Kan ik nog data uit andere bronnen koppelen aan de data over deze betrokkene? Ook als je besluit de data niet te koppelen; als het zou kunnen dan is dit relevant.
  • Is het mogelijk om uit de beschikbare data over een betrokkene andere data af te leiden? Ook hier geldt dat niet de vraag is of je dat als onderzoeker wilt doen maar of het zou kunnen.

Kun je tenminste één van deze vragen met “ja” beantwoorden, dan zijn de gegevens niet anoniem maar pseudoniem.
Dit betekent dus ook dat in al het onderzoek waarbij gebruik gemaakt wordt van een uniek identificerend nummer voor een respondent, er sprake is van pseudonieme gegevens en dat de eisen die de AVG stelt aan verwerking van deze gegevens gelden. Echt anonimiseren is erg lastig maar pseudonimiseren van gegevens is wel een waardevolle eerste stap om de persoonsgegevens van je respondenten te beveiligen.

Uitvoeren van onderzoek: data opslag en veilig delen

In het datamanagementplan beschrijf je hoe je de onderzoeksdata wilt opslaan. Ook waarborg je de veiligheid van de data en plan je hoe je onderzoeksdata kunt uitwisselen met medeonderzoekers.

Opslaan van je eigen onderzoeksdata:
Onderzoeksdata voor eigen gebruik worden opgeslagen op het HU netwerk. Er is een plaats speciaal ingericht voor HU onderzoek: de Onderzoeksschijf. Hiervoor wordt voor per lectoraat, met de daarbij behorende onderzoeksprojecten, opslagcapaciteit beschikbaar gemaakt. Ook de langdurige opslag is (voorlopig) op deze plek geregeld. Werk je buiten de HU, dan is deze opslagruimte bereikbaar via een VPN verbinding.

Externe harde schijven, USB sticks, Dropbox etc. worden niet gebruikt om HU onderzoeksdata op te slaan. Deze opslagmedia zijn niet veilig.

Veilig delen met anderen:
Voor het veilig delen van data met andere instellingen is SURFdrive beschikbaar. Als je samenwerkt met andere Nederlandse onderwijsinstellingen dan is SURFdrive erg geschikt om bestanden veilig te delen.
Je kunt het vergelijken met een veilige versie van Dropbox of Google Drive.
Via openbare links kun je ook mappen delen met externen. Je bepaalt zelf de rechten van met wie je deelt.

Grote bestanden (versleuteld) versturen:
Incidenteel grote bestanden versturen doe je met SURFfilesender. Je kunt het vergelijken met een veilige versie van WeTransfer.  Je kunt de bestanden versleuteld versturen met een wachtwoord volgens de Advanced Encryption Standard met een 256 bits sleutel.
Het bestand wordt dan in versleutelde vorm op een veilige server opgeslagen. Vervolgens mail of app je de ontvanger het wachtwoord. De ontvanger, voert het wachtwoord in en ontvangt dan het bestand, dat pas bij ontvangst weer leesbaar wordt.
Op deze manier kun je dus op een verantwoorde manier gevoelige (video)data delen met bijvoorbeeld studenten. Maak wel de afspraak dat deze na gebruik de ontsleutelde bestanden weer van hun eigen computers wissen.

Handmatig bestanden versleutelen (encryptie):
Wil je handmatig bestanden versleutelen (encryptie) met je HU laptop dan kan dat met 7-ZIP. Deze tool kun je via het HU Software Center downloaden.
Bovendien comprimeer je ook nog eens je data, zodat het minder ruimte inneemt. Stel voor maximale veiligheid de encryptie in op Advanced Encryption Standard 256 bits (AES-256).

Bestandsformaten
Als bewijsvoering voor je onderzoek dienen de onderzoeksdata gedurende een wettelijk bepaalde termijn bewaard te blijven (tenminste 10 jaar) en toegankelijk voor derden te zijn.
Ieder bestandsformaat loopt het risico om verouderd te raken. Als een formaat veroudert, wil dat zeggen dat men met de huidige software niet meer in staat is om de inhoud van het bestand te gebruiken of weer te geven zoals bedoeld toen het bestand werd gemaakt. Om veroudering voor te zijn, kan een aantal voorzorgsmaatregelen worden genomen. Een van die maatregelen is om bestandsformaten te gebruiken die een hoge kans hebben om vele jaren bruikbaar te blijven.

De organisatie Data Archiving and Networked Services (DANS) heeft als richtlijn dat bestandsformaten die het beste geschikt zijn voor duurzaamheid en toegankelijkheid op de lange termijn:

  • Veel worden gebruikt
  • Open specificaties hebben
  • Onafhankelijk zijn van specifieke software, ontwikkelaars of leveranciers,

Voor het duurzaam bewaren van data heeft DANS een lijst van voorkeursbestandsformaten opgesteld, waarvan verwacht mag worden dat deze formaten langdurig leesbaar blijven danwel omgezet kunnen worden naar nieuwere formaten.

Afronden van het onderzoek: Opslaan van onderzoeksdata

Onderzoeksdata dienen veilig en duurzaam te worden opgeslagen zodat zij als bewijsmateriaal kunnen dienen voor de publicatie en mogelijk ook gebruikt kunnen worden voor verder onderzoek. Het gaat dus om data archivering en hergebruik.
Subsidieverstrekkers kunnen vragen om dit in datamanagementparagraaf al ver van tevoren vast te leggen.

Van belang is om goed te regelen wie er toegang krijgt tot de data. Ook is belangrijk te bepalen voor welke termijn de data minimaal opgeslagen dienen te worden.
In Nederland zijn er twee instituten die dataopslag verzorgen: DANS en voor technisch wetenschappelijk onderzoek, 4TU.ResearchData.

Je kunt als onderzoeker je datasets (gratis tot 100 GB) voor de lange termijn opslaan in EASY van DANS.
Log de eerste keer in met je instelling (HU) en maak dan je persoonlijke EASY account aan. Dan is je account gekoppeld aan de HU.

Doe je technisch wetenschappelijk onderzoek, dan kun je je datasets bij 4TU.ResearchData archiveren. Tot 10GB per jaar uploaden is gratis. Bij meer data betaal je per Gigabyte. De HU heeft nog geen instellingsaccount bij 4TU.ResearchData. Maar je kunt via het uploadformulier een persoonlijk account aanmaken.

Veilig werken met onderzoeksdata op niet-HU apparatuur

Bij praktijkgericht onderzoek aan Hogeschool Utrecht worden steeds meer studenten betrokken. De studenten verzamelen en/of bewerken gegevens voor het onderzoek. Ook delen HU onderzoekers onderzoeksgegevens met partijen buiten de HU.
De ICT voorzieningen voor HU medewerkers zoals laptops, cloudopslag en voorziening voor file transfers, kortom de voorzieningen voor het opslaan en delen van onderzoeksgegevens, zijn beveiligd tegen ongeoorloofde toegang en tegen het onbedoeld verloren gaan van de gegevens.
Ook worden er automatisch reservekopieën gemaakt van de data.
De kans dat opgeslagen of gedeelde onderzoeksdata in verkeerde handen komt en/of ontoegankelijk wordt is hiermee tot een minimum beperkt.

De ICT voorzieningen van studenten en sommige externe partijen hebben bovengenoemde beveiliging niet en vormen daardoor een potentieel datalek.
Het is in de meeste gevallen niet mogelijk is om studenten of externen toegang te geven tot de HU ICT infrastructuur. De rechten om de onderzoeksvoorzieningen te gebruiken zijn voorbehouden aan medewerkers.

Daarom is het belangrijk dat er duidelijke afspraken gemaakt worden met studenten en externen over hun werkwijze bij het omgaan met het verzamelen, opslaan, bewerken en delen van HU onderzoeksgegevens en dat de volgende regels worden nageleefd:

  • HU onderzoekers die onderzoeksdata met (bijzondere) persoonsgegevens uitwisselen met studenten en externe partijen, pseudonimiseren of anonimiseren deze onderzoeksdata vooraf, zodat niets herleidbaar is tot personen.
  • HU onderzoekers gebruiken voor het uitwisselen van onderzoeksdata met studenten en externe partijen die geen account hebben in SURF drive of SURF Research Drive, een openbare link (met wachtwoord en redelijke vervaldatum), gemaakt in SURF drive of SURF Research Drive. Het wachtwoord wordt apart verstuurd.
  • Studenten en externe partijen maken bij het bewerken van de data zoveel mogelijk gebruik van applicaties die bestanden rechtstreeks in de cloudopslag bewerken zoals Microsoft Onedrive, Office 365 en Teams. Zo hoeven de data niet te worden gedownload naar de eigen devices.
  • Als wel bestanden naar de eigen device worden gedownload duidelijke afspraken maken over het wissen van deze bestanden.

Wettelijke kaders omgang met onderzoeksdata

Een van de aandachtspunten binnen het project is privacy. Prof. dr. Ellen Gerrits, lector logopedie: participatie door communicatie, vertelt in dit filmpje over de Wet Medisch Wetenschappelijk Onderzoek (WMO) en de Ethische Commissie Onderzoek Gezondheidsdomein (voorheen Medisch Ethische Screeningscommissie). Wat kunnen we ethisch gezien van proefpersonen vragen en hoe leggen we deze data zo vast dat ze niet te traceren zijn naar de individuele mensen?

Met welke wet- en regelgeving en afspraken dienen onderzoekers en studenten die betrokken zijn bij onderzoek rekening te houden bij het verzamelen, opslaan, delen en archiveren van onderzoeksdata?

Switch to English English
× App de balie