Research Data Management

Research data management kan forståeligt nok opleves som en besværlig opgave, men fordelene ved god data management er mange. Eksempelvis kan god data management:   

  • hjælpe dine fagfæller og dig selv med at forstå forskningsprojektet og dets data.
  • gøre det lettere at samarbejde og dele data.
  • gøre forskningen mere synlig, hvilket kan føre til flere citationer.
  • gøre forskningen mere gennemsigtig, pålidelig og reproducerbar.
  • undgå tab af data. 

Husk at du skal leve op til AU's ”Forskrift for opbevaring og håndtering af forskningsdata”.

Få et overblik over, hvordan du behandler data i de forskellige faser af din forskning.


LIVSCYKLUS FOR FORSKNINGSDATA

Struktureringen af det efterfølgende følger denne version af data livscyklussen. 

PLANLÆG

Overvej, hvordan du vil arbejde med data på en fornuftig måde hele vejen igennem projektet.


Overvej, inden du går i gang

Inden du går i gang med et forskningsprojekt, bør du overveje, hvilken type data, du skal arbejde med.

Her kan du se de data, der er omfattet af AU's forskrift for opbevaring og håndtering af forskningsdata: 

Personoplysninger inkl. pseudonymiserede data 

Andre datatyper der er underlagt begrænsninger

Datatyper der ikke er underlagt begrænsninger

  • Alle andre datatyper end ovennævnte, herunder anonyme data er ikke underlagt begrænsninger.  

Undersøg, om der allerede eksisterer relevante data

Det bliver mere almindeligt at publicere og dele datasæt. Undersøg derfor, om der allerede eksisterer datasæt, du kan genbruge eller integrere i din forskning.

Nogle kilder til mulige data er listet under afsnittet Publicering.

Til søgning efter egnede repositorier anbefaler vi Re3data. Re3data.org dækker både generelle og fagspecifikke repositorier.   


Lav en data management plan (DMP)

Når du laver en DMP, efterlever du principperne om åbenhed og transparens ved at dokumentere, hvor data kommer fra.  

Ved at beskrive, hvem der har skabt data og metadata, hvornår og under hvilke betingelser, data er skabt, bidrager DMP til at forstå data og gøre forskningsresultater reproducerbare. 

En DMP beskriver det workflow, data gennemgår i et forskningsprojekt, stort eller lille.

Generelt er det en god ide at tage stilling til, hvordan man forventer at indhente, opbevare og arkivere/publicere data. Nogle gange er det et krav fra en bevillingsgiver, at der skal vedlægges en DMP til ansøgningen, og ofte har de deres egen skabelon. Undersøg derfor om den fond, du vil søge penge hos, har krav til DMP og evt. også deres egen udviklede skabelon.

En god DMP er et levende dokument, der opdateres gennem hele forskningsprocessen. En god DMP skal kunne svare på følgende:

  • Hvor vil du opbevare data? 
  • Tager du backup jævnligt og sikkert? 
  • Hvem er ansvarlig for opbevaring, backup og sikkerhed ift. de date, som du indsamler? 
  • Hvilke foranstaltninger har du gjort for at forebygge uautoriseret adgang til data?  

DMP Online  er et redskab, der guider dig igennem oprettelse af en DMP.  AU tilbyder i samarbejde med AU Library support i DMP Online. 

Find inspiration til DMP i Zenodo.     

 

INDSAML/PRODUCER

Overvej, hvordan du vil indsamle/producere data på en fornuftig måde.


Integrerede, eksisterende miljøer

For en række situationer eksisterer integrerede miljøer. Ofte vil der også tilbydes assistance. Disse omfatter:

  • Center for Humanities Computing AU, ARTS tilbyder assistance til forskerne og er ved at opbygge en infrastruktur, som kan understøtte forskningen i alle faser. Opbygger også datarepositories.
  • Center for integrated Register-based Research er et center, som blev etableret på Aarhus Universitet i 2012 for at fremme tværfaglig forskning inden for samfundsvidenskab, sundhedsvidenskab og visse områder af naturvidenskab.
  • Arkæologisk IT leverer serviceydelser inden for dataindsamling, styring og analyse til kulturarvssektoren. De fungerer som partner i forbindelse med mange store forskningsprojekter og tilbyder støtte og undervisning til en række organisationer og projekter.
  • Genome centret (også nationalt) GenomeDK er en national højkapacitetsenhed med udstyr til behandling af data inden for bioinformatik og life science. Enheden ledes af Center for Genome Analysis and Personalized Medicine på Aarhus Universitet.    

Hertil kan AU IT hjælpe, hvis man som forsker har et særligt behov ift. en mindre IT-løsning eller -service. Vær opmærksom på, at AU IT som udgangspunkt vil etablere alle nye IT-løsninger og -services i cloud. Læs mere (LINK KOMMER). 

Det anbefales, at du ved projektstart beslutter hvilket værktøj, du vil bruge til at dokumentere din indsamling og analyse. Flere af ovenstående har valgt et eller flere værktøjer. Desuden kan følgende bruges: 

  • Jupiter Notebook
  • e-labbøger

OBS! LISTEN UDDYBES LØBENDE


Indsamlingsværktøjer godkendt til følsomme personoplysninger

På AU er følgende indsamlingsværktøjer godkendt til følsomme personoplysninger: 

RedCap 

SurveyXact 


Midlertidig opbevaring af det indsamlede/producerede data

Når du indsamler data er det vigtigt, at du gemmer dem på opbevaringssteder, som er godkendte til den form for data, som du indsamler. Du kan læse om dataklassifikation og se en liste, hvor de forskellige opbevaringssteder er gennemgået.

Du bør bruge universitetets primære opbevaringsløsninger til at opbevare din forskningsdata - Se en oversigt over AU's dataopbevaringsløsninger.


Store mængder data/øget sikkerhed

I nogle tilfælde kan der være behov for en særlig opbevaringsløsning - enten fordi der er tale om en meget stor mængde data, eller hvis der er yderligere sikkerhedsforanstaltninger, der skal opfyldes - fx hvis du arbejder med følsomme personoplysninger.

Kontakt den lokale IT-support, de kan vejlede i, hvad der findes af opbevaringsløsninger.  


Backup

Bruger du AU's netværksdrev (U)fællesdrev/folder (O) eller AU's SharePoint-løsning behøver du ikke tænke på backup, da dette sker automatisk.  

Der er selvfølgelig situationer, hvor data ikke umiddelbart kan lagres på netværksdrev mm. Fx når du indsamler data i felten, eller mens beregninger pågår. Her bør du sikre dig, at der tages en backup af data, så snart det er muligt. I mellemtiden anbefaler AU, at du bruger alternative krypterede backupmuligheder, fx et krypteret USB-stik. Læs mere om kryptering.  

Du bør bruge universitetets primære opbevaringsløsninger til at opbevare din forskningsdata. Se en oversigt over AU's dataopbevaringsløsninger.


Samarbejde om data

Har du brug for at dele dine data med samarbejdspartnere, findes der forskellige løsninger:

Teams og SharePoint

FileSender

  • FileSender er et værktøj til dig, der har brug for at sende en fil, som er for stor til at blive vedhæftet en mail. 
  • Log ind på https://filesender.deic.dk/filesender/ med dit WAYF-login og upload din fil. Vælg modtager og tryk send.
  • Modtager vil så få en mail med et link, der bruges til at downloade filen.
  • Det er også muligt at sende en såkaldt "upload-voucher", hvilket muliggør, at du kan modtage filer fra andre.
  • Upload kan tage flere minutter alt afhængig af din internetforbindelse.
  • Læs mere om servicen på www.deic.dk/filesender

BEARBEJD/ANALYSER

Der findes mange programmer, som kan bruges til dataanalyse.

Overvej hvilke(t) du vil bruge til at bearbejde/analyse data. Du kan vælge at udnytte de cloud-løsninger med computing og storage, som AU IT stiller til rådighed. Her kan du aktivere og installere forskellige programmer. Du kan også vælge at benytte en af de andre platforme, som stilles til rådighed. Nogle af disse er ren regne- og lagerkapacitet, andre tilbyder støtte til metodevalg.


Integrerede miljøer ved AU

For en række situationer eksisterer integrerede miljøer. Ofte vil der også tilbydes assistance. Disse omfatter:

  • Analytics Group er Aarhus BSS’ lokale analyse IT-service, hvor medarbejdere og studerende kan få hjælp til analyseprogrammer i forbindelse med forskningsprojekter og skriftlige opgaver.
  • Center for Humanities Computing AU, ARTS tilbyder assistance til forskerne og er ved at opbygge en infrastruktur, som kan understøtte forskningen i alle faser. Opbygger også datarepositories.
  • Center for integrated Register-based Research er et center, som blev etableret på Aarhus Universitet i 2012 for at fremme tværfaglig forskning inden for samfundsvidenskab, sundhedsvidenskab og visse områder af naturvidenskab.
  • Arkæologisk IT leverer serviceydelser inden for dataindsamling, styring og analyse til kulturarvssektoren. De fungerer som partner i forbindelse med mange store forskningsprojekter og tilbyder støtte og undervisning til en række organisationer og projekter.
  • Genome centret (også nationalt) GenomeDK er en national højkapacitetsenhed med udstyr til behandling af data inden for bioinformatik og life science. Enheden ledes af Center for Genome Analysis and Personalized Medicine på Aarhus Universitet.    

Løsninger til computing og storage

DeiC koordinerer brugen af de nationale supercomputere, der er til rådighed for danske forskere. Supercomputerne drives og udvikles af universiteterne, som stiller regnetid til rådighed for forskere uafhængigt af institutionelt tilhørsforhold.

Supercomputere (HPC) | Danish e-Infrastructure Cooperation (deic.dk)

Som en del af det nationale initiativ vil de otte universiteter oprette et lokalt front office, der skal yde support til HPC-brugere på universitetet. De nationale HPC-centre og back office i DeiC vil samarbejde med de lokale front offices om at få brugerne godt i gang med at anvende HPC-ressourcerne.

På Aarhus Universitet er kontaktpersonerne:

Type 1: Center for Humanities Computing Aarhus (CHCAA) - chcaa@cas.au.dk 

 

Type 2: Dan Ariel Søndergaard - das@biomed.au.dk

PUBLICER/DEL

Når du er færdig med at bearbejde og analyse data, skal forskningsresultaterne deles i fx forskningsjournaler eller bøger.

Du kan også dele data i datatidsskrifter eller datarepositorier, så andre kan genbruge dine data, og på den måde sikrer du, at dine data bliver brugt, citeret og licenseret korrekt.

For at gøre dette skal du sikre, at data er anonymiseret, at data gemmes sikkert, og at data udstyres med en såkaldt persistent Identifier (PID, DOI,…).


Entydige identifikatorer

Forskningsdata har stor værdi både for dig, men også for andre forskere. Du kan gøre det nemmere for andre at referere til eller bruge dine forskningsdata ved dels at give dem en persistent identifier og ved, at du deler dine data med en tydelig licens. 

En PID (persistent identifier) er en unik nøgle, som bruges til at identificere et givet dokument, datasæt eller en person permanent.

Ofte er der få beskrivende metadata knyttet til en PID. PID’er gør det muligt for andre at finde dine data og referere til dem.

Jvf. FAIR principperne gør PID’er data mm. findbare og tilgængelige (F og A i FAIR principperne).   

Eksempler på persistent identifiers: 

  • DOI (Document Object Identifier) bruges til dokumenter, data og datasæt. De fleste repositorier kan generere og vedligeholde DOI'er eller andre PID.  
  • Forsker-id’er er et andet eksempel på PID’er. De bruges til at sikre, at en given person ikke forveksles med en anden, f.eks. med samme navn, ved at tildele hver enkelt et unikt nummer. ORCID er et eksempel på et forsker-id, hvor en person tildeles et unikt nummer, som kan bruges til id. 

Betingelserne for at få adgang til og for at genbruge data skal også fremgå. Dette kan ske gennem brug af Datalicenser, der bruges til at vise, om dine data må bruges af andre, og hvordan de må genbruges (R i FAIR-principperne).  


Anonymisering af personoplysninger

For at personoplysninger kan betragtes som værende anonyme, må det hverken være muligt at identificere enkeltpersoner ud fra oplysningerne alene eller i kombination med anden information.

Læs mere om anonymisering.


Repositorier

Repositorier kan hjælpe dig med at gøre dine data søgbare (F’et i FAIR principperne).  

De kan guide dig et langt stykke hen ad vejen, hvis du vil gøre din forskning kompatibel med FAIR principperne. Publicerer du dine data i et åbent repositorie som fx Dataverse eller Zenodo, vil de fx kunne hjælpe dig med at: 

  • sætte et DOI op 
  • have felter til metadata og beskrivelser, som er relevante 
  • tildele dine data en datalicens.  

På AU har vi ikke et institutionelt repositiore, men der findes mange åbne respositorier, du kan benytte dig af. Ofte vil valget afhænge af fagområde, men der er også flere tværfaglige. 


Zenodo

  • Zenodo er et generelt open access repositorium til data, software og publikationer for forskere, der gerne vil dele forskningsresultater.
  • Det er udviklet og ejet af CERN og er gratis at anvende.
  • Alle filformater accepteres, og man kan uploade op til 50 GB per datasæt.
  • Alle data får tildelt en DOI, og man kan tildele data en licens.
  • Det er muligt at uploade data med begrænset adgang. Data opbevares i repositoriets levetid, og programmets levetid er mindst 20 år (fra 2020).
  • Zenodo bekender sig til FAIR-principperne

Support:

Vil du vide mere?


Dataverse

  • Harvard Dataverse er et gratis data repositorium for forskere fra alle discipliner.
  • Data bliver automatisk tildelt en DOI, og det er muligt at begrænse adgangen til data.
  • Alle datasæt er automatisk tildelt Creative Commons License CC0, men den kan fravælges.
  • Man kan uploade alle filformater op til 2,5 GB samt opbevare op til 1 TB data. 
  • Dataverse garanterer langtidsbevaring, dog uden at sætte tid på.

Support: 

Vil du vide mere?


LOAR The Royal Library Open Access Repository

  • Library Open Access Repository (LOAR) er et depot for åbne data. 
  • LOAR blev etableret i 2016 som opbevaringsservice for danske forskningsdata.
  • Forskere, der uploader data til LOAR, forventes at gøre det under en Creative Commons licens.
  • LOAR egner sig derfor ikke til personfølsomme eller ophavsretlige data.
  • I forhold til pris kan man hos LOAR opbevare data under 10 GB gratis i fem år.
  • Hvis data overstiger 10 GB eller skal gemmes i mere end fem år, kan man kontakte LOAR for priser.
  • Det Kgl. Bibliotek yder support til brugere af LOAR.
  • Læs mere: 

Support

Vil du vide mere?


Mendeley Data 

  • Mendeley Data er et gratis repositorium for åbne data. 
  • Mendeley ejes af forlaget Elsevier og understøtter alle dataformater og fagdiscipliner.
  • Data tildeles DOI og licens.
  • Det er muligt at gøre data fortrolige eller at sætte en embargoperiode.
  • Data lagres i skyen og kan udveksles via en åben API.
  • Individuelle datasæt op til 10 GB kan uploades.
  • Permanent langtidsbevaring garanteres. 
  • Mendeley bekender sig til FAIR principperne. 

Support

Vil du vide mere?


Github

  • Github er en open source samarbejdsplatform for forskere, oprindelig etableret til deling og udvikling af software. 
  • Github tilbyder både gratis og betalingsservices.
  • Gratis lagring op til 500 MB.

Support

Vil du vide mere?

 


Tidsskriftsforlag

De store tidsskriftforlag samarbejder typisk med udvalgte repositorier. Her er nogle af forlagenes anbefalinger: 


Licenser

En ophavsmand til et værk kan overdrage hele eller dele af sin ophavsret ved en licens. Der findes forskellige licenser til forskellige formål. Siden choosealicense.com giver et overblik over forskellige licenser.   

Creative Commons

BEVAR

I henhold til Aarhus Universitets politik for forskningsintegritet, forskningsfrihed og ansvarlig forskningspraksis skal forskningsdata opbevares i mindst fem år, medmindre anden lovbestemt opbevaringsperiode finder anvendelse ift. forskningsprojektet og kræver længere opbevaring. 

Vær opmærksom på, at den gældende lovgivning kan være reguleret i samarbejdsaftalerne.

Forskningsdata må kun destrueres, anonymiseres og/eller arkiveres, når de enten er afleveret i sin helhed til Rigsarkivet, eller når en af følgende betingelser er opfyldt: 

  • Når opbevaringsperioden er udløbet.
  • Efter institutlederens beslutning.
  • I overensstemmelse med retsgrundlaget for indsamling af data

I henhold til bekendtgørelse om anmeldelse af forskningsdata til Rigsarkivet skal du som en hovedregel anmelde data fra et afsluttet projekt til Rigsarkivet.

Sådan anmelder du forskningsdata til Rigsarkivet 

Hvad skal ikke anmeldes?

Følgende typer af forskningsdata er undtaget fra anmeldelsespligten:

  1. Forskningsdata, som er skabt gennem eksperimenter eller simulationer, der kan gentages.
  2. Forskningsdata, som er skabt alene ved samkøring af administrative registre.
  3. Forskningsdata, som publiceres i deres helhed i publikationer, der er omfattet af Lov om pligtaflevering af offentliggjort materiale i Danmark.
  4. Forskningsdata fra projekter under ph.d. niveau. Forskningsdata fra ph.d.-projekter er ikke omfattet af undtagelsen og skal anmeldes efter bestemmelserne i stk. 1.

AU's muligheder for opbevaring af data i endelig form

AU har 4 forskellige typer opbevaring til data i endelig form. Uanset hvilken form data har og hvordan behovet for at kunne læse data er, kan der findes en løsning til de bevaringsværdige data.

Find information om AU's opbevaringsløsninger til data i endelig form.

GENBRUG

Den Nationale strategi for research data management, som er baseret på FAIR-principperne, tilskynder til, at data i videst muligt omfang deles med andre forskere - at data gøres FAIR.

Er dine data gjort FAIR, vil andre kunne finde og genbruge dem. Skal andre vide, hvordan de må bruge dine data, er det vigtigt, at du har lagt en licens sammen med data, som beskriver betingelser.

Du kan læse mere om FAIR på AU Librarys website.  

På www.howtoFAIR.dk kan du finde information om, hvordan du praktisk kan gøre forskningsdata mere FAIR. 


Samarbejdsplatforme og deling af data

Læs mere om samarbejdsplatforme og muligheder for at dele data under PUBLICER/DEL.