Referater fra møder i data management-koordinationsgruppen

Referat af møder 2022

Referat af møde den 2. december 2022.

Deltagere:

Birte Christensen-Dalsgaard (BCD), Torben Brejnegaard-Nielsen (TBN), Rasmus Handberg (RH), Peter Severin de Fønss (PSF), Jakob Hjort (JH), Sara Marie Westh (SMW) Per Møldrup Dalum (PMD)

Afbud: Jens Grønbech (JG), Anja Sandbæk Holm (ASH) og Kirsten Krogh Kruuse (KKK).

BCD lægger næste møde 15 min senere, så deltagerne har tid til transport.

Dagsorden:

  1. Godkendelse af dagsorden
  2. Godkendelse af referat (bilag 2.1: referat)
  3. Orientering fra arbejdsgrupperne B og C i forhold til den nationale strategi (Bilag 3.1,2,3) (20 min)
  4. Orientering fra det DeiCs DM Rådgivende Udvalg AAI (Bilag 4.1) samt DMPOnline (15 min)
  5. CircleU – Vi skal levere AU input omkring støtte for forskningen. Udkast er vedlagt som “input v1.3”, Bilag 5.3, som jeg godt vil have tilbagemelding på. Til orienteering er vedlagt ”Recommendation to policy makers” (til orientering bilag 5.1) og til information om konteksten for input er vedlagt practical guide (bilag 5.2) (15 min)
  6. Dagens tema: Kompetenceudvikling – 1 time
  1. Hvad kan vi gøre sammen
  2. Hvad er de største behov, kan bla. være
    • ERDA/SIF?
    • DM planer?
    • GDPR? (ved godt, vi pegede på dette som tema; men der er ved at blive nedsat en gruppe, som skal udarbejde vejledninger i forhold til SIF. Så afventer lige den.
    • Licenser?
    • Hvor kan jeg publicere data – nok lidt præmaturt
    • Hvor finder jeg datasæt?
    • Hvordan kan jeg vurdere kvalitet?
  1. På hvilke områder er der behov for ”train the trainer”
  2. Evt. (5 min)

BCD bad om feedback på mængden af materiale udsendt inden mødet. Der var enighed om, at det skal markeres hvilke dokumenter der ønskes læst vs. TO.

Da gruppens formål også er videns udveksling, er alt stof udsendt af BCD delbart, med mindre det modsatte eksplicit skrives.


  1. Godkendelse af dagsorden.

Forslag til ændring: super hurtig opdatering på ERDA SIF status fra TBN.

JH spurgte til sammenhængen mellem ERDA SIF og OS. Han ser systemerne som storage.

BCD: der kommer et metadata repos., der ikke er bygget til storage, kun handler der peger på data i ERDA SIF.

JHs perspektiv er, at han arbejder med persondata, som ikke skal blive liggende. Pseudonom. Data skal også blive liggende i 5 år, men der er ikke afklaring på hvad der skal ske med data derefter.

FAIR data er ikke nødvendigvis åbne – det skal bare fortælles hvor de findes, og hvordan man får adgang.

PSF: opbevaring kan ikke nødvendigvis forlænges på baggrund af at data er FAIR.

BCD: der arbejdes hen imod, at automatisk sletning ikke skal ske efter 5 år. F.eks. miljødata er personfølsomme på AU. Hvis de slettes efter 5 år forsvinder historikken.

Set fra Health forplumrer ERDA SIF og OS hinanden.

BCD: freeze fuktion vil kunne lave DOI.

PMD: ERDA SIG er to systemer, og det er også to projekter dvs. AU og Nat. TBN: det vil ikke nødvendigvis være samme projektgruppe, der arbejder med den nationale løsning.

JH: ERDA SIF bliver ikke det eneste repositorie, og fokus kan derfor spænde ben for begge agendaer.

BCD: ERDA vil være AUs første mulighed for at mønte DOIer.

OS Forum ser holistisk på emnet. DM gruppen skal følge op på den nationale strategi og arbejde målrettet med målsætningerne.

Referatet blev godkendt.

PMD: der er ændringer i situationen efter referatet. BCD: det der er sket siden skal tages op her.

PMD: DM Rådgivende forum. CTS: der blev sat spørgsmålstegn om hvorvidt det er dataverse eller de enkelte universiteter, der skal certificeres. Det bliver op ad bakke.

PMD: spørgsmål om VDI: det er ikke klart om det er med i løsningen eller ej. BCD: ERDA SIF er storage, og de omkringliggende systemer er et separat emne.

Rapportering fra arbejdsgrupperne.

BCD: arbejdsgruppe A har reference til rigtig mange bilag, som ikke er tilgængelige. De har taget udgangspunkt i 5 cases, og fokuserer på samarbejde på tværs.

Der vil komme en fælles rapport fra følgegrupperne, og den vil være offentlig.

PMD for B: infrastruktur (dok vedlægges).

Langtidsopbevaring – omformuleret til specifikt 5 til 15 år.

Retningslinjer for brug af licenser.

Nat tjeneste for DM værktæj

Cert af metadata repos.

Friteksten var begrænset, men rigelige bilag vedlagt f.eks. under punkt 7.

Sammenfattede kommentarer: RA nævnt som repos. På den lange bane.

Nat enighed om hvordan de kommende infrastrukturer kan bruges til den lange periode.

Brug af licenser retningslinjer er ikke udbredt over hele linjen.

DMP Online lavet af digital curation centre, som stadig udvikler værktøjet.

DM rådgivende forums anbefaling er at selvom DMPOnline har nogle begrænsninger (f.eks. machine actionability) forsætter vi med den de næste par år.

BCD for C: økonomi (præsentation vedlægges).

Hvad vil fondene støtte?

Møde med fondene 1/12.

Identificering af FAIR relaterede udgifter. Langtidsopbevaring er stadig den store joker – procedure og tid er stadig i spil.

Skabelse af metadata for anvendelse og tilgængelighed.

7 respondenter til tradition omkring FAIR.

Vi har ikke en eneste respondent fra AU, for systemet sender det rundt.

Den eneste udgift respondenterne så ligge hos inst. i fremtiden var løbende dokumentation. Der er en trend imod at få finansiering udefra.

Spørgsmål om man skal være eksplicit omkring hvad man har brug for – skal det være direkte eller indirekte omkostninger? KU direk. Bl.a. arbejder videre med emnet. Området er i udvikling.

D er gået videnskabelig til værks. Det handler om hvilke emner, der skal undervises i. Katrine Flint Holmstad.

PSF: E

Status quo.

Lokale undersøgelser så forskerne kan identificere hvilke data der kan give problemer med åben adgang. F-eks. Dual use eller kortlægning af kritisk infrastrutur i risikable geografiske områder. Den side skal over i A for politiker. Det er kun forskerne selv, der har indsigten til at identificere de områder.

BCD: det spiller sammen med fokus på FAIR snarere end Open – vi skal ikke dele alt med alle. EOSC kunne f.eks. blive med tryk på European, for at begrænse.

Tidsperspektivet: EU rammeprogrammet ser på 2028 nu.

BCD: nogle grupper tænker arbejdet er færdigt, andre vil fortsætte. John Renner er stemt for det sidste.

DeiC DM rådgivende forum

De har stillet kravene til både Dataverse og den nationale løsning på nat storage.

Nat storage var til start samarbejde mellem AU og KU, men BV trak i håndbremsen, så drift kommer til at ligge hos KU. Udrulningen på AU har peget på nogle svagheder og forbedringspunkter. Det kommer til at påvirke det nationale.

AU er med i konsortiet, men opgaverne med drift kommer ikke til at ligge hos os.

TBN: bemandingsproblemerne og opdateringer til lustre har haft meget stor indflydelse på processen. Systemet har ikke til start kørt på lustre. ,

Det nye mandskab har fået øje på nogle mangler, som skal udbedres. Men funktionaliteten set fra en slutbrugers synspunkt er den samme, så vi kører tests – men ikke på SIF og ikke med personhenførbare data.

TBN: muligheder for tests med pseudon. Data. BCD: hvis OneDrive og o-drevet kan håndtere pseudon.data burde SIF også kunne, da det system også har logning.

Den nye forventede start dato er 1/2, og projektperioden vil blive forlænget på næste styregruppemøde (6/12)

BCD: der vil ske migrering fra AUs ERDA SIF til den nationale løsning. ERDA skal der kun være en af. SIF kan vi grunde til at køre selv, men den beslutning er ikke taget endnu.

BCD: beskeden er: kom i gang med det lokale.

Et andet emne: AA eller AAA infrastructur authentication and authorisation infrastructure. P.t. burger vi WAYF, men forskellige roller (f.eks. admin, forsker, PI, RA) kræver modernisering af systemet, f.eks. ved samarbejde med eksterne.

Opdateret system bliver relevant både for organisationerne og i forbindelse med f.eks. HPC.

DMP Online er et andet indsatsområde – det er ikke videre brugervenligt, kræver f.eks. gentastning af information.

Alle er enige om at det skal ændres, men listen bliver meget lang.

En mulighed er DMP educational, som kan give eksempler og gode eksempler til inspiration. Det system skal være tilgængeligt og selvforklarende, for forskerne vil generelt lede efter det når de har brug for det.

Novo N støtte vil snart, mener BCD, kræve DMP også for personhenførbare data.

Hvad skal det næste år indeholde? Hvor skal fokus ligge på nationalt plan? Meld ind til BCD og JH.

Health har lavet en sandkasse hvor man kan lære om at bruge datascience. JH er blank.

BCD mener Arts har noget lignende. KLN har måske tænkt det, men DMP mener ikke det forligger.

National health data science sandboc for training and research (google). Siden er fra 2020 og projektet er støttet af Novo N.

Sandbox ideen ift. data science. TBN: det er rigtig godt med et sikkert miljø, hvor folk kan finde ud af det.

PMD: det ville ikke være dyrt, for alle på DK unier har alligevel 1000 point til rådighed.

BCD: hvis det er kontrollerede dataset er det klart hvad resultatet skal være, og så kan man også fejl teste sig selv. BCD vil spille den ind hvis vi begynder at køre data science.

Kulturelle forskelle gør sig gældende omkring sandboxes – man skal ikke ”lege” hos Health. Ordet ”øve” dækker samme proces: en beskyttet måde at bruge de tilgængelige værktøjer, og arbejde sig op til en kompetence hvor man kan bruge de større ressourcer og få øget indsigt.

BCD bad om input til CircleU udkastet.

Fokus på studerende og OS. Glider ind i Open Education.

To deliverables:

Input til policy makers (basis UNESCO)

Practical guide til forskerne. Tanker er, at den skal kunne udlevers til AUs forskere. Guiden er næsten direkte oversat fra Frankrig. Vi skal lave input til fact sheet, som viser forskerne hvor de skal gå hen. BCD har samlet hvad hun kunne finde, og beder om input.

Open Education Resources – kan man dele I BrightSpace?

PMD: er OER undervisningsressourcer: vi bruger GIThub, for Brightspace er ikke dynamisk.

BCD: har I lavet en delmængde af GIThub, så man kan identificere at stoffet kommer fra jer? PMD: det ville være smart.

RH og PMD er enige om at Brightspace ikke er svaret her.

BCD: hvis vi ikke har en løsning vil jeg fjerne den.

Open Source ditto. Hvis AU havde defineret en delmængde i GIT hub kunne det virke med kildekode.

AU skulle bruge sin egen GIT lab, og pushe den.

PMD: Der findes et fint NeiC GIT lab.  

BCD afleverer den i aften, så det er deadline for tilbagemeldinger.

BCD: hvorvidt den er god nok bliver et spørgsmål, men da AU er med i CircleU bliiver det den officielle for os.

PMD note til punktet: a choice of different AU-tailored DMPs. Det er håbet at vi når dertil inden de går i pressen. AUL står for DMPOnline, så bekræftelsen mangler fra KKK. BCD vil vende dokumentet med hende inden afsendelse.

PMD: skabelonerne kunne blive meget bedre, må gerne kunne skaleres ned, og gøres meget mere specifikke. De fleste på Arts kommer med ønsket om at lave en DMP, og uden mål er det svært.

Hos Nat halter den ved template fra f.eks. ERC.

BCD vil genbesøge udkast til værktøj fra tidl., som blev godkendt af TTO og afvist DPO.

Generelle templates for hvilken slags data man har og med fokus på forskningsprocessen ønskes af PMD og RH.

Færre fritekst og flere afkrydsningsfelter ønskes også.

BCD: problematisk med definition af f.eks. kvantitativ versus kvalitativ data.

Kompetenceudvikling

Et udvalg er ved at blive nedsat omkring GDPR data, for at klargøre hvad der skal i ERDA og hvad i SIF.

Udvalgt nedsat af prodekanerne for forskning, og hvert fakultet skal stille med en. SMW og BCD skal med, BCD formegentlig kun til første møde.

BCD redegjorde for gruppens baggrund (OS Forum) og første opgave (kommissorium).

JW nedsætter gruppen. PMD er med fra Arts. Carsten fra BSS. Jurist fra FE.

Kurser/kompetenceudvikling.

BCD ser det som udvidelse af supporten.

JH f.eks. laver møder i redcap, så han er kompetencen på feltet. Vi skal vide hvad de andre kan og hvad de udbyder.

Når spørgsmålene bliver detaljerede skal de lokale kompetencer træde til.

Supporten skal kunne håndtere ERDA SIF. SMW jager svar på train the trainer behov.

Værktøjer f.eks. til publicering, licenser, kvalitet.

BCD: de åbne workshops omkring redcap er den gode historie. JH fortæller. I redcap kan forskerne sætte deres egne projekter op, med 100% kvalitative data. Den omfatter Health og dele af BSS, og nu også via AUs hjemmeside nu til alle. Health åbnede licensen til at dække hele AU. Der er ingen økonomiske vinkler.

JH hver evig eneste uge, torsdag 13-16, lokale til åbent møde. Spørgsmål fra brugerne samles og løftes, og de konkrete spørgsmål får svar. Det geniale er, at de ikke dyrker viden, for når folk kommer med spørgsmål bliver de nødt til at lytte til andres vinkler også, og dermed kommer de længere ud i krogene. Der kommer mellem 7 og 12 til hvert møde, og der nogle gengangere når et projekt er på vej mod deadline. Der er ca. 3.000 brugere af redcap.

Det er kun interessant i design-fasen – i produktion er det irrelevant.

JH håndterer samtlige spørgsmål selv.

BCD: det JH gør er at gøre problemerne relevante på bredere plan.

JH har lavet en video, der sætter brugerne i gang. Deres brugere finder en del svar selv.

TBN: det er også en effektivisering af supporten.

PSF: det er rullet drypvist ud – institut -> fakultet -> AU.

BCD kan se flere emner, hvor modellen kan bruges, f.eks. DMP op imod ansøgningsfrister.

PMD: AUL gør noget lignende det med kodning, og man kunne gøre det med UCloud og de nationale centre.

RH: det kræver en stor brugergruppe.

BCD man kunne stille på frekvens eller tid med mindre brugergrupper.

JH: på redcaps forside står der datoer, steder for workshops.

RH: GIT kunne vi også promovere på den måde. Det er et centralt system or alle, der arbejder med kode.

PMD: arbejde med data, der går forud for den videnskabelige proces, f.eks. rengøring.

PMD: licenser og hvor finder jeg data – burde det ikke ligge på BA? Eller helst helt nede i folkeskolen.

BCD har ikke fundet et sted hvor det er påkrævet. Vi har de videnskabelige kurser, men ikke yderligere.

Møde med phdskolerne: mulighed for at ligge noget ind hos vejlederne, måske et frivilligt kursus, der giver ECTS.

Juristen og AUL data manager på ARTS holder introduktions-oplæg.

BCD: forslag om at finde hvad der er, og sammen med KB lave et ECTS kursus. Man kunne evt. lave 1/3 af kurset fag-specifikt.

RH: licenser kunne laves med værktøj. GIT hub har en licens finder. Creative Commons ligeså (men ikke for kode). Vi kunne henvise til dem.

Licens: gruppen vil skrive noget sammen.

PMD: instrukser: hvad må man som forsker?

BCD: institutlederen har det overordnede ansvar for al data. Institutlederen skal derfor godkende at forskerne deler generelt. Vi skal muligvis anføre hvornår folk skal have det godkendt af IL. Hvis vi finder et godkendt værktøj, kan IL henvise til det.

Cambridge – Open Research: data champions (ca 200).

De gør det for netværket og for at have en alternativ karriere-vej. Mange post doks ansat som DM i et projekt – den type folk. Derudover nogle få forskere med interesse i data.

Frokostmøde hver anden uge.

Åbne seminarer.

OS Forum planlægger et seminar til foråret – men skulle vi lave et møde fra DM, f.eks. et gå-hje-møde? Eller er det for tidligt? RH mener det er et par mnd for tidligt. BCD tager den op igen om 6 mnd. PMD venter på ERDA SIF. Dataverse overpå.

Det er uklart hvad dataverse skal hedde?

Evt.

RH: hvad gør vi med at lave centrale hjemmesider? Information omkring DM. Vi skal undgå dobbelt arbejde.

BCD har tre forskellige sider om DM: research-data-management.

Plan om at samle IS, GDPR, rådgivninger, AUL samlet med AUs hjemmesider, så der kun er en indgang for forskeren. Den afventer også ERDA SIF.

BCD og SMW dialog med AAU om et lignende projekt. De vil også lave decentral forskersupport.

BCD efterlyste input til det generelle, og specifikke kommentarer.

Folkesundhed har glimrende DM, og meget store softwareløsninger. CIRRAU ditto.

Referat af møde den 28. oktober 2022.

Deltagere: 

Birte Christensen-Dalsgaard (BCD), Per Møldrup-Dalum (PMD), Rasmus Handberg (RH), Jens Grønbech Hansen (JGH), Jakob Hjort (JH), Anja Sandholdt Hald (ASH), Torben Brejnegaard-Nielsen (TBN), Sara Marie Westh (SMW), Kirsten Krogh Kruuse (KKK), Peter Severin de Fønss (PSF).

Dagsorden:

  1. Velkommen, præsentation af deltagerne samt formål med gruppen (10 min)
  2. Kort baggrund for arbejdet – nationale strategi samt rapport fra arbejdsgrupperne nedsat af følgegruppen (20 min)
  3. Hvert fakultet samt KB giver en kort præsentation af, hvordan man griber opgaven an (1 time – 10 min til hver)
  4. Kort status for implementeringen af ERDA/SIF (10 min)
  5. Identifikation af emner for fremtidige møder og aktiviteter (20 min)

  1. Velkommen

Mødernes deltagerne vil variere, men hvert fakultet har en fast deltager.

Dagsordenen blev godkendt.

  1. Baggrund for arbejdet

BCD gennemgik det fremsendte materiale.

Ledelsesopbakning er en hjørnesten. På AU udgør OS Forum den instans og kan nedsætte arbejdsgrupper, hvoraf DM koordinationsgruppen er den første.

BCD udlagde de strategiske mål for OS arbejdet: at fostre en kulturændring, dvs. få forskerne til at forholde sig til OS, integrere DM i forskningsprocessen, og bidrage til gode praksisser og standarder for håndtering af data og metadata.

AU understøtter kulturændringen ved at sikre infrastrukturen, gøre de nødvendige kompetencer tilgængelige, og anerkende datadeling som forskningsrelevant.

BCD gennemgik det organisatoriske setup bag OS på AU med SPOC som forskernes vej ind. SPOC kunne være en email, med ticketing system, til start.

(Den opdaterede tegning af setuppet er sendt ud med referatet).

JGH fra gruppe A (politikker, værktøjer og forskerstøtte til FAIR DM):

Gruppen har indsamlet 5 use cases og derigennem identificeret best practice og workflow for implementering af FAIR principperne.

De fokuserer også på udarbejdelse af DMPer, der kan facilitere processen.

JGH efterlyste status på implementering på AU, og resten af gruppen var enig.

BCD så DM koordinationsgruppen som indgangen til at få arbejdet forankret på AU: gennem vores samarbejde vil vi opnå det nødvendige perspektiv.

PMD fra gruppe B (etablering af FAIR infrastruktur med nat. DM-tjenester):

PMD er i under-arbejdsgruppen der fokuserer på langtidsopbevaring: 5-15 år, og her er ERDA, SIF og Dataverse konkrete løsninger.

Ang. licenser har DK universiteter ikke politiker for hvilke licenser data skal have.

DMP online kunne forbedres, f.eks. mulighed for at sætte figurer ind.

Certificering af anbefalede tjenester: Core Trust Seal, hvilket Dataverse overvejer.

Gruppen oplevede manglende klarhed omkring de organisatoriske veje på AU.

Ang. licenser havde BCD gennemført en undersøgelse, der viste mest brug af CC BY og CC BY-SA.

BCD fra gruppe C (FAIR finansieringsplan):

Fondene er overvejende positive. De stiller ikke flere penge til rådighed, men vil gerne øremærke fordelte midler til DM-aktiviteter, f.eks. at gøre data FAIR, hyre en data steward, sikre langtidsopbevaring.

Gruppe C udsendte også et spørgeskema, men BCD har ikke kunne finde nogen på AU, der vil svare.

AU har ingen repræsentanter i gruppe D (Plan for opbygning af FAIR kompetencer og viden):

Gruppen har lavet en afdækning af materiale til kompetenceudvikling, og har fundet rigtig meget. Det meste henvender sig til ph.d.erne.

PSF fra gruppe E (Plan for samarbejde om sikkerhed og GDPR):

Gruppen består overvejende af GDPR folk, med få IS specialister.

Fokus har været på at skabe et samarbejde om at forhindre datadeling med folk, der ikke må have adgang. Det vil munde ud i anbefalinger omkring adgangsstyring og etablering af en stærk governance struktur.

PSF nævnte vigtigheden af at inddrage forskerne for at identificere muligheder for dual use (forskning som kan vendes til militært formål).

Arbejdet med GDPR afventer datatilsynets nye vejledning. I samhør med følgegruppen er indsatsen sat på pause. Den nye vejledning forventes ikke før 2023.

Gruppen diskuterede GDPR og mulighederne for generelt formidlingsmateriale og fælles værktøjskasse baseret på use cases. BCD bemærkede slutteligt at GDPR kan være et emne gruppen her tager op på et senere møde.

  1. Fakulteterne og KB præsenterer hvordan man griber opgaven an

ASH om BSS:

GDPR har været primært fokus. Prodekanen nedsatte en task force for DM og GDPR, med en arbejdsgruppe for hvert emne.

DM gruppen fokuserede på ERDA SIF. BSS har stærke forventningen om en VDI løsningen mod 3. lande. TBN forsikrer at den er i det opdaterede kommissorium.

BSS har desuden diskuteret muligheden for brugeradgang til Fortegnelsen.

De har ikke drøftet FAIR i dybden endnu.

GDPR gruppen fokuserede på overførsler til usikre 3. lande og systemejerskab.

JH om Health:

Arbejdsgruppen er nedsat, men afventer fakultetsledelsens møde.

Den kliniske forskning er som udgangspunkt FAIR, i nogen grad forankret i feltets traditioner.

JGH om Tech:

Han er formand for det lokale DM udvalg, som har en række anbefalinger til ledelsen: bevidsthed, information, DMP, ERDA SIF, at tid og penge allokeres til DM, dataflow fra feltet, og use cases for at dokumentere FAIRifikation.

De arbejder med at skabe en værktøjskasse, der kan deles med resten af AU.

JGH foreslog et heldags seminar om DM for at fostre en forståelse af forskellene og lighederne mellem fakulteterne, og give mulighed for samarbejde fremad.

BCD kommenterede at OS forum har planer om et lignende seminar til sommer, for at give ledelsen den nødvendige viden.

PMD om Arts:

DM er forankret i IKS hos CCC. ARDMS gruppen indeholder brede kompetencer, og dens opgave er at definere hvordan DM skal håndteres på Arts.

De har en central SPOC med ticketing system til alle henvendelser. De spredte viden ad hoc og gennem word of mouth.

Arts har ikke noget storage; de bruger UCloud indtil ERDA SIF kommer.

ARDMS hjælper især lokale forskere med DMP. DMPer går typisk til AUL, men komplekse sager går til CHC og ARDMS.

De har desuden fokuseret på læring, udvikling, og afprøvning af metoder.

RH om Nat:

Nat er ikke så langt, men behovsafdækning blandt DM folk har identificeret konkrete systemer at pege på som en mangel. RH planlægger info-kampagne om ERDA SIF i de lokale miljøer, for det konkretiserer DM. Han har indbudt interesserede og institutlederne har udvalgt folk, så alle institutterne er repræsenterede.

RH forklarede på forespørgsel at selvom han er ikke officielt med i ERDA SIF implementeringsgruppen arbejder han med næste skridt i ERDA SIF udrulningen, og er på den centrale gruppes liste over piloter.

BCD forklarede at DM grupperne på sigt vil blive del af ERDA SIF setuppet lokalt.

KKK om KB:

KB understøtter universiteternes DM politik, den nationale strategi, og forskerne.

De udbyder en række DM services og underviser forskere og ph.d.-studerende i bl.a. DMP, datasøgning, og referencer. De afholder desuden årlige dialogmøder.

De har kurser for ansatte og ph.d.er og vejleder i registrering af datasæt i Pure.

KB indgår i samarbejde med AU, bl.a. sidder vicedirektøren for AUL i OS Forum.

Nationalt er KB involveret i implementeringen af den nationale strategi, og internationalt deltager de i LIBER og Skills4EOSC.

Endelig afholder KB interne data science workshops for kompetence udvikling.

BCD fremhævede vigtigheden af at skabe klarhed omkring hvornår forskerne skal henvende sig på biblioteket hhv. universitetet. Dvs. informationen skal samles.

AUL er åbne for samarbejde. Dette vil blive starten på et mere formelt bindende og tættere samarbejde, vurderede BCD.

  1. Kort status for implementeringen af ERDA/SIF

SMW sender opdateringer om udrulningen til gruppen sammen med referat.  

  1. Identifikation af emner for fremtidige møder og aktiviteter

På baggrund af den tidligere diskussion forslog BCD GDPR/IS og kompetenceudvikling.

  1. Evt

Mødekadencen vil til start være en gang om måneden, så deltagerne har rig mulighed for at inspirere hinanden i opstartsfasen.

TBN beder om en klarere retning på GDPR i ERDA SIF regi og beskrivelser af GDPR fra de forskellige fakulteter. PMD bad i den forbindelse om vidensdeling.

Referat af møder 2023

Referat af møde den 14. december 2023.

Deltagere: Birte Christensen-Dalsgaard (forperson) (BCD), Jens Grønbech Hansen (JGH), Jesper Lykkegaard Karlsen (JLK), Søren Broberg Nielsen (SBN), Kirsten Krogh Kruuse (KK), Torben Brejnegaard-Nielsen (TBN), Allan Timmermann (AT), Sara Marie Westh (referent) (SMW)

Afbud: Per Møldrup-Dalum, Jakob Hjort

1.    Dagsordenen blev godkendt
Samlet præsentation for mødets punkter vedlægges referatet.

2.    Orienteringspunkt: Arbejdsgruppen for implementering af Rigsarkivets bekendtgørelse om anmeldelse af datasæt (ved Birte)
Danske Universiteter nedsatte i 2022 en arbejdsgruppe med det formål at koordinere de danske universiteters implementering af Rigsarkivets bekendtgørelser (nærmere beskrevet i vedlagte præsentation). Formand for arbejdsgruppen er Brian Vinter, prodekan for forskning, TECH, og repræsentant for AU er Vicedirektør for AU IT, Peter Bruun. 

BCD fremlagde Arbejdsgruppens status og planer. Data management-koordinationsgruppen havde særligt fokus på tre hovedoverskrifter: 

•    Anmeldelse af forskningsdata
Retroaktiv anmeldelse af forskningsdata udgjorde et hovedpunkt for arbejdet mellem arbejdsgruppen og Rigsarkivet. På baggrund heraf er Arbejdsgruppen og Rigsarkivet nået til enighed om at anmeldelse skal finde sted i to situationer: 
1.    ved migrering af data til anden platform
2.    ved offboarding af videnskabeligt personale

Fsva. fremtidig anmeldelse af forskningsdata ved Rigsarkivet er man i dialog om, at Rigsarkivet kan høste fra det kommende nationale re-positorium, DeiC Dataverse.

•    Omkostninger ifm. langtidsopbevaring
Koordinationsgruppen diskuterede herefter omkostninger ifm. langtidsopbevaring. BCD oplyste, at Rigsarkivet vil afholde disse i forhold til materiale afleveret til Rigsarkivet. I forbindelse med aflevering skal ske en omformatering til arkivformat; omkostninger hertil afholdes af den afleverende myndighed.

•    Informationskampagne
Informationskampagne om anmeldelse af data til Rigsarkivet vil blive tilrettelagt af RDO evt. med bistand fra Kommunikation og Presse. Derudover vil kontoret på sigt udarbejde vejledning om hvordan data pakkes og en oversigt over standardformater for data.

3.    Orienteringspunkt: Følgegruppe og arbejdsgrupper ifm. National strategi for data management baseret på FAIR-principper (ved Birte)
Til støtte for implementeringen af National strategi for data management baseret på FAIR-principper har Uddannelses- og Forskningsstyrelsen nedsat en følgegruppe med ansvar for national koordinering af arbejdet og herunder seks arbejdsgrupper, der er etableret for en ny mandatperiode (1. januar 2023-31. december 2024). BCD gennemgik deres sammensætning. 

Idet samtlige AU’s medlemmer af arbejdsgrupperne sidder i Koordinationsgruppen (på nær arbejdsgruppe C omkring økonomi), blev det besluttet fremover at tilføje et fast punkt på gruppens agenda: ”Status på følgegruppe og arbejdsgrupper”. 

4.    Orienteringspunkt: status for ERDA og SIF (ved Sara Marie)
SMW fremlagde status samt oversigt over udrulningsaktiviteter for Koordinationsgruppen (nærmere beskrevet i vedlagte præsentation). 

Usikkerhed omkring genskabelse af enkeltfiler på baggrund af replikering blev diskuteret. TBN afdækker emnet i samarbejde med systemadministrationen.
 
Afslutningsvis bemærkede JLK, at såvel afklaring ift. datagenskabelse som overblik over omkostninger ifm. backup er nødvendig forud for yderligere lokal udrulning. For at imødegå dette behov vil SMW undersøge omkostningerne ifm. backup i samarbejde med systemadministrationen og præsentere det på Koordinationsgruppens næste møde, 1. marts 2024. 

5.    Orienteringspunkt: Dataverse (ved Birte/Sara Marie/Kirsten)
BCD sagde, at hun netop var blevet oplyst om, at Dataverse forventes klar til brug 1. februar 2024, efter tidligere udmeldinger fra projektet havde anført launch date som sommer 2024. Hun gennemgik derefter kort systemets relationer til den øvrige infrastruktur (ERDA og SIF).

Ift. forankringen af Dataverse på AU bemærkede BCD, at RDO sandsynligvis vil fungere som hovedadministrator med lokale administratorer på fakulteterne. 

Koordinationsgruppen drøftede Dataverse. I den forbindelse fremhævede gruppens medlemmer særligt flg. punkter: 
o    Behov for metode for reference til primærdata. Stor usikkerhed omkring workflow, hvor data forbliver på AU servere og metadata publiceres i Dataverse.
o    Vedligeholdelse af data i Dataverse ønskes støttet af en rollebaseret tilgang, evt. forankret i institutledelsen.
o    Det er vigtigt, at der ikke indføres dobbeltarbejde i forbindelse med publicering.

Der var bred enighed om, at værdien af Dataverse, herunder også løsninger til de ovennævnte punkter, løftes bedst ved en fastsættelse af workflows til Dataverse.

Afslutningsvis foreslog BCD, at funktionalitet ift. overblik og søgning kunne opnås ved at benytte PURE. For at dette giver mening, vil det kræve, at poster publiceret i Dataverse automatisk overføres til PURE. KB mener, at dette kan lade sig gøre. I forhold til data publiceret udenfor Dataverse, skal disse indføres manuelt.

6.    Datas værdi - hvad skal gøres FAIR (ved Birte) 
Punktet overgår til Koordinationsgruppens første møde i 2024.

7.    Evt.
JGH rejste to punkter; signalværdi og arbejdsgang. 

Ad signalværdi
Det er oplevelsen, at Dataverse informationsmaterialet benytter negative termer omkring datamanagement (”gemme data”, ”arkivere data”, ”deponere data”). En positiv reformulering med fokus på datas genbrugelighed og genfindelighed blev i stedet foreslået (”bevare data”, ”sikre data”). 

Ad arbejdsgang
Det er en bekymring, at det er vanskeligt for ledelsen at nå at sætte sig ind i mødematerialet forud for møderne. 
SBN og BCD fremhævede, at det ikke er hensigten, at ledelsen skal sætte sig ind i det fulde materiale, men i stedet trække på ekspertise fra deres bagland. 


Videre proces
Det blev aftalt, at Koordinationsgruppens medlemmer deler feedback på og inspiration til den mulige strukturering, der udfoldes i præsentationen til punkt 6, Datas værdi, med forpersonen. 

Mhp. at vurdere hvilken ressourcemængde hvert medlem kan dedikere til arbejdet med Datas værdi, blev det aftalt, at Koordinationsgruppens med-lemmer afklarer det acceptable ressourceforbrug med deres ledere inden næ-ste møde [nu] den 25. april 2024 i Open Science Forum.

Referat af møde den 29. september 2023.

Mødedato: 29 september 2023, 9.15-11
Mødested: Navitas lok. 05.057
Mødeemne: Data management koordinationsgruppe møde

Deltagere: Birte Christensen-Dalsgaard (BCD, forperson), Anja Sandholt Hald (ASH), Jakob Hjort (JH), Jens Grønbech Hansen (JGH), Jesper Lykkegaard Karlsen (JLK), Kirsten Krogh Kruuse (KK), Per Møldrup-Dalum (PMD), Søren Broberg Nielsen (SBN), Sara Marie Westh (referent)

Gæst: Peter Severin de Fønss (PDF)

Afbud: Torben Brejnegaard-Nielsen (TBN)

5 min:        Godkendelse af dagsorden
15 min:      Status ERDA/SIF – ved Sara Marie
60 min:      Udrulning af DataVerse – hvad har I brug for af informationsmateri-ale, kursusmoduler osv.
20 min:      Vidensdeling omkring kompetenceudvikling – gode erfaringer, gode ideer, hvad fungerer, hvad mangler
5 min:        Evt.

Velkommen til vores nye medlem, Jesper Lykkegaard Karlsen. Jesper arbejder med sci-computing på MBG, dvs. IT for forskerne og datamanagement.

Dagsordenen blev godkendt.

Temadag

Programmet er udsendt og 75 tilmeldte (pr. 2/10: 80). Målgruppen er forskere. Programmet slutter kl. 16, men vi ligger op til at folk kan blive en halv times tid længere.

BCD ønsker at afslutte med at vise kontakter på fakulteterne. Pt. mangler Tech at melde ind med en sådan. BCD og JGH vil rykke Brian Vinter. Slides ligges ud efter temadagen, så bliver kontakterne offentlige.

Status på ERDA og SIF

På mødet blev der spurgt til hvad inodes er. Det er en pointer til filens placering, så mange små filer giver mange inodes.

Gruppen foreslog følgende opgaver ifm. afklaring omkring data deling:

  1. Centrale møder er planlagte. Til disse vil usecases blive præsenterede.
  2. Usecases bruges til at identificere behov. Dette behov kan risikovurderes.
  3. På basis af risikovurderingen kan de økonomiske rammer for løsninger fastlægges.

Cybersikkerhed - databeskyttelsenhedens arbejde og erfaringsudveksling mellem deltagerne

Punktet er TO og skal ikke afføde konkrete beslutning, men en indsatsbeskrivelse. Processen er at omkalfatre udmeldingen, for operationelt at kunne stille krav, f.eks. til SOP og instrukser til medarbejdere. Gruppen blev bedt melde bekymringer eller misforståelser ind på mødet.

Fakulteterne er involverede i arbejdet via en besøgsrunde foretaget af AU IT.

Da indsatsen skal på UL 29/11 mhp. bestyrelsen i december skal skrivet være færdigt 1/11. SBNs oplæg bliver at en ny klassifikation for forskningsdata/produkter/output er nødvendig.

SBN bad om lov til at sende skrivet til medlemmerne for deres input, hvilket de indvilgede i. Da skrivet stadig er fortroligt skal det ikke vendes i miljøerne.

Under diskussion af præsentation blev følgende diskuteret:

  • Nødvendigheden af at skelne mellem admin IT og forsknings IT.
  • Punkt 3 vedrører systemer snarere end data. SBN læser det som et statement om, at systemet må være et andet, men det må ikke have et lavere sikkerhedsniveau.
  • Medlemmernes bekymring omkring sikkerhedsniveauet ift. forskningsfriheden: hvis AU ikke kan acceptere datatab ifm. med forskning er der ikke forskningsfrihed. SBN ser friheden i skrivet, men i sammenhæng med det bredere risikobillede.
  • JGH tilbød en use case til gennemgang og belysning af vejen til compliance. SBN takkede ja, men ønskede den tidligst efter 14 dage, da første fase arbejde er presserende.

Dataverse

  • Gruppen vurderede at data stewards vil være nødvendige for systemets liv på AU.
  • Gruppen foreslog denne plan for udrulning i vores forum:
  1. Sandkasse session
  2. Richard Dennis inviteres til møde
  3. Sandkasse session
  4. Norge inviteres til møde

Værdi og bevaring af data

OS Forum vil fokusere på datas værdi og de overvejelser, der indgår i spørgsmålet om bevaring. Derudover er en ny gruppe under den nationale strategi nedsat til dette emne.

AU bliver et datacenter når vi tager ansvar for data i Dataverse. Vi kan hente inspiration fra andre datacentre: de har en checkliste og et ansvar.

Emnet vil blive taget op konkret på gruppens næste møde og vil involvere medlemmerne nært, da har den nødvendige viden om miljøet og ved, hvad der fodrer ind.

Evt.

  • JGH: den nye samarbejdsaftale med WUR. ASH rådede til at kontakte NATs jurist. TECH og BSS har en aktie ifht. NAT.
  • AI bruges og udvikles på ARTS og ses som det nye internet, men sikkerheden og etikken skal afklares, hvorfor PMD skal på 2-dags kursus hos kammeradvokaten. P.t. er kravene ift. etisk, hvorfor det er derfor vanskeligt at lave en central udmelding. SBN forventer fokus på produktansvar når den nye AI act kommer.

Referat af møde den 22. juni 2023.

Mødedato: 22 juni 2023, 9.15-11
Mødested: Navitas lok. 05.057
Mødeemne: Data management koordinationsgruppe møde

Deltagere: Birte Christensen-Dalsgaard (forperson), Per Møldrup Dalum, Jakob Hjort, Søren Broberg Nielsen, Kirsten Krogh Kruuse, Anja Sandholt Hald, Jens Grøn-bech Hansen, Sara Marie Westh
 

5 min:        Godkendelse af dagsorden
15 min:      Status ERDA/SIF – ved Sara Marie
60 min:      Udrulning af DataVerse – hvad har I brug for af informationsmateri-ale, kursusmoduler osv.
20 min:      Vidensdeling omkring kompetenceudvikling – gode erfaringer, gode ideer, hvad fungerer, hvad mangler
5 min:        Evt.


1.    Dagsorden blev godkendt

2.    Status ERDA/SIF
På nuværende tidspunkt ERDA ikke mønte DOIer, men funktionaliteten kom-mer. 
Det samme gør sig gældende for integration med DataVerse.

3.    Udrulning af DataVerse 
Systemet er forsinket, så udrulning ikke kan påbegyndes. Da AU vil være ansvarlig for egen onboarding, blev gruppen bedt om at identificere support, der kan udgøre lokalt front office. AUL/KB samarbejder med OS omkring arbejdet. 

AU vil bruge required local support model, som ifl. DeiC vil kræve 1,5 FTE. 
Rollerne i modellen blev gennemgået og fordelt: 
-    Administrator: OS
-    Curation: i fagmiljøerne, med træning
-    Support: central administration (OS) og lokalt ansvar (DM support centre)
-    Training: delt ansvar. OS/KB laver materiale baseret på DeiCs oplæg, som kan tilrettes lokalt
-    Community: OS
-    Use cases: via OS, men indsendes af de lokale grupper 

DataVerse besøgsrunde (sept/okt) ønskes i samspil mellem DM gruppen, AUL/KB og OS. Gruppen blev derfor bedt om at finde den bedste løsning til deres miljøer.

Gruppen debatterede ”arkiv” vs. ”repositorie”. Arkivering og bevaring blev set som passive, hvorimod DataVerse omhandler publicering og deling, som er aktive. 

Der var et ønske om at koordinere kommunikationen for at undgå forvirring mellem ERDA, SIF og DataVerse.

DataVerse instanserne vil kunne konfigureres, men det er uklart hvor meget ar-bejde det kræver og om det vil kunne matche forventningerne om tilretning. 

4.    Vidensdeling omkring kompetenceudvikling
Metadataskemaer havde BCD rejst i DeiC, hvor interessen ikke var stor. 

En case blev rejst, hvor dataset der stilles til rådighed bliver misbrugte. For at undgå det kan forskeren publicere i en data journal. Fordelen ved data journals er at de giver en ekstra publikation. Det kunne indgå i best practice.
KB opfordres til at gå ind i emnet, evt. ved at samle en liste over tidsskrifterne.

5.    Evt.
Gruppen diskuterede den organisatoriske omlægning. Forskerservice vil få tre enheder: TTO, fondsansøgninger og forskningsdata og -administration. 
OS slås sammen med DPO kontoret, DPO-opgaven udliciteres og jurister flytter ind. Resultatet bliver et kontor med fokus på alle aspekter af datahåndtering. 
Det ønskes at afspejle ændringerne i de lokale support-enheder. 

Gruppen diskuterede dataejerskab. Efter ændring af retningslinjerne ejer AU ik-ke data. ASH gav kontekst: en henvendelse fra UBVA blev drøftet af BSS akademiske råd, som ikke kunne fastslå at ejerskab altid lå hos AU. Derfor fastslås det nu case by case. 
Det blev fastslået at ledelsesbeslutningen om risikoprofilen skal signaleres til fa-kulteterne for klarhed omkring rammerne.
Gruppen var enige om at institutlederen grundlæggende skal tage ansvaret. 

Next steps: 
NAT leder efter et nyt medlem til gruppen. 
SMW introducerer JGH og Anders Møller pr. mail. 
BCD sender retningslinjerne til gruppen.

Referat af møde den 17. april 2023.

Deltagere: 

Birte Christensen-Dalsgaard (BCD), Per Møldrup-Dalum (PMD), Jens Grønbech Hansen (JGH), Rasmus Handberg (RH), Anja Sandholt Hald (ASH), Søren Broberg Nielsen (SBN), Kirsten Krogh Kruuse (KKK).

Forhindrede: 

Sara Marie Westh (SMW)

Dagsorden:

5 min:   Godkendelse af dagsorden og godkendelse af referat
10 min: Status ERDA/SIF – ved Sara Marie
10 min: Orientering om tanker i forhold til udrulning af DdataVerse -– ved Birte og Kirsten
10 min: Orientering om evt. fælles aktivitet omkring gode eksempler på DM planer (AAU, DM-netværk) – ved Sara Marie og Birte
60 min: Tema: Licenser til ……… indledning Birte, ellers alle. Hvad bruger I nu? Hvilke udfordringer har I? Hvad bør AU forholde sig til på ledelsesniveau?
20 min: Vidensdeling omkring kompetenceudvikling – gode erfaringer, gode ideer, hvad fungerer, hvad mangler
5 min:    Evt.


Punktet omkring ERDA/SIF skubbes til næste gang da Sara Marie er syg.
Med denne ændring er dagsorden godkendt

Referat blev godkendt

Orientering om tanker i forhold til udrulning af DataVerse- ved Birte og Kirsten

Der er lavet en aftale mellem AU og KB/AUL om samarbejde om specielt support i forhold til udrulningen af DataVerse.

Status for implementeringen og en overordnet oversigt over de fremadrettede opgaver blev præsenteret, som fremgår af vedhæftede præsentation.

Orientering om evt. fælles aktivitet omkring gode eksempler på DM planer

Der er etableret et samarbejde mellem AAU og AU om at samle gode eksempler på DMPer. Formålet er at finde gode eksempler på besvarelse af enkeltpunkter – og ikke at finde DMPer, som i deres helhed kan danne forbillede på en sådan.

Licenser

Når vi begynder at forvente, at forskerne publicerer deres data i henhold til kravene i den nationale strategi, skal vi også kunne svare på spørgsmål omkring som minimum de obligatoriske felter i DataVerse. Et af disse er licensen.

Fra Mail, som blev udsendt før mødet:

Der findes meget materiale og der er allerede visse steder på AU allerede udfærdiget anbefalinger (noget skal man jo sige). ODIN-projektet har fået (og bruger) anbefalinger fra Dylan Roskams-Edris, som er open alliance officer hos Tanenbaum Open Science Institute i Canada. Han har en jurabaggrund, og arbejder til daglig med alle de juridiske spørgsmål i forhold til åbenhed i forskning:

My very basic w/o explanation rules of thumb are:
 
•    Data = CC0
•    Technically the “best practice” for data is to use a CC0, which eliminates copyright or other IP rights in data (which may or may not exist) to the greatest extent allowable by law (this varies. In some places you can’t give up these rights). Using CC-BY is ok… but just know that in some/most cases the licences are irrelevant because there is no IP, meaning that people using the data aren’t actually bound by it. Even if rights do exist, using CC-BY could lead to some undesirable consequences when people try to combine datasets, but it is a pretty common practice in the open science world so you are probably fine.

•    Witten material (papers, protocols/methods), visuals, audio = CC-BY

•    Software = open source license approved by the Open Source Initiative
•    The closest to a CC-BY (for software) is to use one of the “permissive” licenses, for example the MIT license or the BSD3 license. These are the “most open” options.
•    Zenodo is really not the best platform for sharing software. It is much better to upload via GitHub with a clear license (like MIT, BSD3, LGPL, or GPL) and then link it to zenodo to create a DOI and make it citable. (here are a few useful links: https://docs.github.com/en/repositories/archiving-a-github-repository/referencing-and-citing-content & https://guides.lib.berkeley.edu/citeyourcode#:~:text=go%20to%20https%3A%2F%2Fzenodo,you%20added%20to%20the%20repo.)
•    The best practice for software is for the license itself to be included in the Github repo (this is also the most common practice). You can then link it to Zenodo to get a DOI and it doesn’t really matter what license you choose for the Zenodo page. I would say recommend they use an Open Source license in their github repo (i.e., any license approved by the Open Source Initiative), and give the example of MIT as a commonly used and very open one, and then use a CC-BY in the Zenodo so that any content they write on the Zenodo page (i.e., description of the software, documentation) is licenced under the CC-BY.

•    Hardware = open hardware license (like the CERN Open Hardware License)

Men hvad kan vi, må vi, vil vi i Aarhus? Beslutningen skal træffes af ledelsen, men diskussionen her kan være med til at kvalificere et oplæg til ledelsen og kan være med til at etablere en fælles ”best practice” indtil vi kommer så langt.

I øvrigt har jeg med stor interesse læst i nedenstående bog, som også ligger online (og jeg har lagt bogversionen ind i vores inspirationsfolder):
How to be FAIR with your data. A teaching and training handbook for higher education institutions
Publication date:

January 26, 2022
DOI: 10.5281/zenodo.6674301
Related identifiers:
•    10.17875/gup2022-1915 (Book) 
•    10.5281/zenodo.5785252 (Project deliverable) 
License (for files):
Creative Commons Attribution 4.0 International

Bogen indeholder nogle rigtige gode overvejelser om læringsmål og kan bruges som en manual til at designe kurser. Den indeholder desuden 16 lesson plans:
Appendix F – Lesson plans, herunder
Lesson plan 9: Licences, copyright and intellectual property rights (IPR) issues

Det er vigtigt i diskussion at skelne mellem åbne data, dvs. data som ikke er underlagt nogen form for lovmæssige eller kontraktlige regler og heller ikke på anden måde er underlagt restriktioner, som forhindrer publicering – og så alle de andre, begrænsede eller lukkede data.

Åbne data – for problemfri data – og for de data, som trods restriktioner, kan gøres åbne
Begrænsede data (engelsk ”restricted”) data, som er data, som der efter ansøgning måske kan gives adgang til 
Lukkede data – data, som der aldrig (indtil om 140 år, hvis de er afleveret til Rigsarkivet) vil kunne gives adgang til.

AUs generelle vejledninger kan findes her:

AU’s GDPR side:
https://medarbejdere.au.dk/informationssikkerhed/databeskyttelse/saerligt-om-forskning

AU’s data management side, som er ved at blive opdaterede og kommentarer modtages gerne):
https://medarbejdere.au.dk/research-data-management/

Åbne data

På mødet blev diskuteret, hvad der gælder for åbne data – og software. Der var almindelig enighed om at rådene fra ODIN var en god guideline, men også, at licenserne fra Open Data Commons var relevante.

Så for data anbefales en af nedenstående 4:
•    Creative Commons Zero (CC0): This license allows you to dedicate your dataset to the public domain, meaning that anyone can use, modify, and distribute the dataset for any purpose without seeking your permission.
•    Creative Commons Attribution (CC BY): This license allows others to use, modify, and distribute your dataset as long as they give you credit for the original work.
•    Open Data Commons Public Domain Dedication and Licence (PDDL): This license is similar to CC0 but has been designed explicitly for datasets.
•    Open Data Commons Attribution License (ODC-BY): This license is similar to CC BY but has been designed explicitly for datasets.

I forhold til software anbefales at bruge
•    one of the “permissive” licenses, for example the MIT license or the BSD3 license. These are the “most open” options.

Rasmus pegede på værktøjet: https://choosealicense.com/, som var rigtig godt til at finde den relevante open source licens. Anbefalingen her er ofte MIT eller BSD3.

På wikipedia er der en god side, der sammenligner de forskellige software licenser:
https://en.wikipedia.org/wiki/Comparison_of_free_and_open-source_software_licenses

Begrænsede data

I DataVerse bør adgangsbetingelsen indføres som ”restricted” – og evt. afklaring må komme gennem et udredningsarbejde, som endnu ikke er påbegyndt.

Lidt inspiration:

Materiale fra FAIRcookbook: https://faircookbook.elixir-europe.org/content/home.html, som har en del afsnit, herunder:
 
I forhold til dagens emne er specielt afsnittet om ”reusability” relevant:
https://faircookbook.elixir-europe.org/content/recipes/reusability.html
og i forhold til diskussion omkring standardiserede måder at styre sensitiv information, og som var den jeg brugte på mødet i dag, 4. Declaring data permitted uses:
https://faircookbook.elixir-europe.org/content/recipes/reusability/expressing-data-use.html

Evt.
Sara Marie og KB er gået i gang med en AU-tilrettet version af ”Open Science, A practical guide for Ph.D. students” – har I input, så send det til Sara Marie eller til Kirsten.

Referat af møde den 20. marts 2023.

Deltagere: 

Birte Christensen-Dalsgaard (BCD), Per Møldrup-Dalum (PMD), Rasmus Handberg (RH), Anja Sandholdt Hald (ASH), Torben Brejnegaard-Nielsen (TBN), Sara Marie Westh (SMW), Kirsten Krogh Kruuse (KKK), Peter Severin de Fønss (PSF), Jens Grønbech Hansen (JGH).

Forhindrede: 

Jakob Hjort (JH)

Dagsorden:

10:15 – 10:20: Velkommen, godkendelse af referat og af dagsorden 
10:20 – 10:45: Opsummering af møde i OS forum – herunder det godkendte roadmap 
10:45 – 11:55: Diskussion af kompetenceudviklingsinitiativer 
11:55 – 12:00: Evt. 


Fremover sendes kommentarer til referatet senest 14 dage efter udsendelse, ellers forventes der ikke at være nogen.

Opsummering af møde i OS forum – herunder det godkendte roadmap:
Plan for en OS temadag er ved at blive udarbejdet. Den vil indeholde et spor for ledere og faglige spor for forskerne. OS kontoret forventer relativt hurtigt at udmelde en dato.
En oversigt over forums arbejde er ligeledes på vej, og vil vise status på de emner, der arbejdes med.

Gennemgang af roadmap:
På opfordring af KB fjernes lead (markeret med fed) hvor andre end OS kontoret er anført. En revideret udgave sendes. Roadmappen tager udgangspunkt i de strategiske mål for AU. 
Aktiviteterne på s. 6 vil kunne køre parallelt (”Seminar og informationskampagne/institut-besøg med information om FAIR”, ”Støtte brugen af Data management planer samt sikre at relevante skabeloner er implementeret i DMP Online”, ”Identificere relevante online undervisningsmateriale i forhold til DMP’er”, ”AU version af ”Practical Guide…” og ”Etablere netværk af Data ambassadører”). 
Ift. Data management planer bruger AU DMPOnline, men DeiC vil undersøge alternativer. 
Ift. ”Seminar og informationskampagne…” (s. 6) er Dataverses tidsplan skredet, hvilket påvirker OS aktiviteterne, så vi ikke forventer at gennemføre FAIR informationskampagne i Q2 2023. 
Ift. ”Identificere relevante online undervisningsmateriale i forhold til DMP’er” (s. 6) blev det foreslået at en arbejdsgruppe kunne kortlægge de ti bedste online kurser der allerede findes.
Ift. ”AU version af ”Practical Guide…”…” (s. 6) tilpassede OS kontoret Guiden til AU og planlagde en dynamisk løsning via en web-version som løberne vil kunne vedligeholdes.
Ift. ”Undervisning i mulighederne for at publicere data” (s. 7) udgør ERDA, SIF og Dataverse ikke automatisk et trusted repository, da trust lå mellem universitet og forskeren. 
Ift. ”Undervisning i mulighederne for at publicere data” (s. 7) forventes sammenhængen mellem ERDA, SIF og Dataverse som følger: data ligger i ERDA eller SIF. Ved publicering får data en DOI, som kan knyttes til metadata i Dataverse. NB Dataverse er ikke bygget til storage. 
Ifl. KU vil Dataverse bruge samme DDI som Danmarks Statistik, dvs. de obligatoriske felter vil være de samme som i DataCite. For at miljøerne kan begynde at skrive metadata, der passer til det skema, vil BCD sende referencen til medlemmerne. 
Ift. ”Alle Ph.d.-studerende kender til FAIR og til DM” (s. 10) besluttede ph.d.-udvalget at det skal varetages af vejlederne (men deres kursusudbydere underviser kun i pædagogik). 
Gruppen diskuterede CC-BY som datalicens. SBN slog fast at der ikke er specielle hensyn ved data ift. rettigheder, men at forskeren skal vide hvilke rettigheder, der gælder i den aktuelle situation, f.eks. ved brug af specialudstyr. 

Diskussion af kompetenceudviklingsinitiativer: 
Medlemmerne vil stå for aktiviteterne, mens gruppen vil udvikle materiale og lave events. 
Studerende står som slutbrugere (s. 12) for at rejse en intern diskussion om deres inddragelse.
Diskussionen udmøntede i disse emner fordelt på skemaet fra præsentationen (s. 12):

Ordbog: ensartede begreber (på dansk og engelsk)

FAIR certificering (inspireret af NeiC)

Kursus: ERDA, SIF og Dataverse

Alternative karrierer/meritering (inspireret af Cambridge’s data champions)

Reference-værktøj -> ”hvad er…”

Uddannelse af datamanagers på fakultets-niveau

Superbruger-uddannelse på sektions- afdelingsniveau

Seminarer

Best practice: eksempler på tværs af fakulteterne for at inspirere og give bredere perspektiv

OS-kursus på BSS Workshops om licenser

KB har på vegne af Danske Universiteter indgået en aftale med Springer Nature Group om open access (Vigtigt skridt for Open Access: Ny aftale med forlaget Springer Nature Group (au.dk)). Motivationen bag den type tiltag er at holde data hjemme, så vi undgår at købe dem tilbage. 

Ordbog:
Modstridende fakta vil ikke altid kunne løses. Der vil være modsatrettede regler, som forskerne skal veje op mod hinanden. Bred generalisering var derfor ikke mulig. 

Repositorier:
Zenodo: data er tilknyttet en bruger, som hænger på en email. Hvis emailen forsvinder, kan data ikke nås. En dansk løsning giver flere muligheder for datastyring. Det vil ikke kræves at alle data ligger ét sted: hvor en international database findes, benyttes den.  
PURE: KU var ved at udvikle et metadata repository, med beskrivelser af samtlige dataset. Fravalget af PURE var ikke klart: det giver overblik over data og forbindelsen til publikationer (Pure (au.dk)).

Samlet indgang:
Research Data Management (au.dk) udbygges evt. efter Practical Guide. Målet er som udgangspunkt at omfatte alt relevant og gradvist skære ned. Ved specialiserede sider linkes ud. Ønsket var ikke at svare på alt, men at kunne henvise til eksperter ved komplekse spørgsmål. Det blev foreslået at skære GDPR til start ud for at fokusere på informationssikkerhed, data management og OS. 
DeiCs DM side lægger ikke op til at være en overordnet platform. En tidligere gruppe under DeiC skrev om bl.a. licenser. Teksterne blev ikke bevaret, men vi genfinder dem. 

Eksisterende og ønskede kurser: 
Træning ønskes mappet på forskningsrejsen for at sikre relevans for forskerne. Workshops skulle være interaktive og nærværende med fagspecifikke komponenter. Ved at invitere OS-kontoret til fagmiljøet og lave både bottom-up og top-down ville dialog og synergi blive sikret. 
På BSS var 4 forskere fra 4 institutter ved at udvikle OS kursus med kvantitativt fokus. Kurset vil også blive tilbudt udenfor BSS. 
PIDer for hardware blev kort diskuteret og det blev besluttet p.t. at fokusere på ORCID og DOI. 
Strategien var at gå ind på nederste niveau for AU, og middel-niveau for fakulteterne. Det blev fremhævet at for at sikre ledelsesstøtte skal aktiviteterne på fakultetsniveau synliggøres. 

Next steps:
Næste møde (17/4) vil fokusere på licenser. Det vigtige er at forskeren ikke sidder med beslutningen. 
BCD sender referencen til DataCites metadataskema til gruppens medlemmer.
BCD tager ideen om ordbogen med til Anders Conrad (DeiC), og spørger om EOSC har en vi kan oversætte. Den sendes derefter omkring det nationale RDM-forum for at søge enighed om termer. 
OS kontoret har møder med AAU og KU og skal derudover have møder med DTU. 
BCD og SMW laver et udspil og snakker evt. med Line Renate Hanssen.

Referat af møde den 11. januar 2023.

Deltagere: 

Birte Christensen-Dalsgaard (BCD), Per Møldrup-Dalum (PMD), Rasmus Handberg (RH), Anja Sandholdt Hald (ASH), Torben Brejnegaard-Nielsen (TBN), Sara Marie Westh (SMW), Kirsten Krogh Kruuse (KKK), Peter Severin de Fønss (PSF).

Forhindrede: 

Jens Grønbech Hansen (JGH), Jakob Hjort (JH)

Dagsorden:

  1. Godkendelse af dagsorden og referat fra sidst (10 min) ved BCD
  2. Spørgsmål til slutrapport fra følgegruppen (10 min; punktet kan udvides, hvis der er mange spørgsmål). Rapporten er medsendt ved BCD
  3. Opdatering og status ERDA/SIF (10 min) ved Sara Marie
  4. Status fra det rådgivende forum for data management ved BCD (brev til bestyrelsen er vedhæftet) 20 min
  5. Tema: undervisnings- og kompetencetilbud – både i form af reelle kurser til slutbrugerne og train-the-trainer forløb.
    1. Behov og forventninger – 5 min fra hver (se evt. spørgsmål 1 nedenfor, men I opfordres også til at se på jeres egen situation – hvor vil jeres arbejde lettes, hvis vi kom ind med undervisningstilbud)
    2. Oversigt over moduler fra KB ved Kirsten
    3. Hvad skal vi arbejde med?
  6. Evt.

Evt. tages først.

Ved en fejl er næste møde lagt i uge 7. BCD vil prøve at flytte det. 

Fremad vil dokumenter fra møderne blive lagt i Teams, hvor andet relevant også kan deles. 

AU-website bliver bygget med DM gruppen som underside til OS Forum. Admin kontakt bliver SMW. OS kontoret havde etableret AskOS@au.dk for overordnet kontakt, men medlemmerne skulle beslutte hvordan de vil kontaktes. Et fælles ticket system (Jira) blev diskuteret, men da BSS ikke har den bagvedliggende organisering klar og da ARTS bruger et andet system, blev det besluttet at bruge funktionspostkasser indtil videre. 

I fremtiden bør fokus være på interaktion, så vi nemt kan dele mellem systemerne. At integrere KBs folk i et AU system vil udgøre en udfordring her og i økonomisk regi. 

For at medlemmerne nemmere kan overskue arbejdet skal der indføres milepæle. De første er etablering af gruppen og identifikation af emner.

Emner, vi forventer: 
•    Ticket system
•    Licenser. 
•    Evt. metadata, da de sikrer at rettigheder gives videre ifm. governance. 
Diskussionen om ERDA kunne evt. indeholde et tema om licenser.
Semantikker og ontologier er centralt i FAIR og er samtidig disciplin-specifik. Best practice skal ligge til grund i det lokale, mens protokollerne faciliterer og understøtter forskningen. 

Arbejdsgruppernes slutrapport: BCD gennemgik indstillinger. 
FAIR handler om maskinlæsbare data, så modenhed er et spørgsmål om funktion. 
Trusted digital repository er et spørgsmål om bagvedliggende organisation, så UL skal beslutte om AU skal etablere den nødvendige governance på området. 
John Renner ønsker at fortsætte arbejdet, men arbejdsgrupperne mener det kræver nye kommissorier. Næste omgang kunne handle om universiteternes implementering. Medlemmerne havde oplevet et stort overlap mellem grupperne og forslog konsolidering, for at placere mere ansvar hos universiteterne. 
Medlemmerne ønskede at høste eksempler på at investeringen bærer frugt, da det ville give stærke argumenter overfor forskerne. Oplæg fra EOSC-konference i La Roche blev fremhævet, da det viste en tydelig økonomisk fordel ved FAIR. 
Eftersom rapporten følger op på den nationale strategi, blev det foreslået, at gruppen fokuserer på den. 

ERDA og SIF status: SMW gennemgik aktuel situation. 
OS Forum har nedsat en arbejdsgruppe til SIF governance. 
Der er tilkøbt ekstern backup til SIF, men ikke ERDA. ERDA har AUs backup til to eksterne lokationer. 
Projektgruppen forventer at implementering varer indtil sommer. 
Ift. SIF er VDI en foranstaltning ved overførsler til tredje lande. Lokal VDI er ikke inkluderet i projektet (lokal VDI bruges visse steder på Health). Ift. SIF handler lokal VDI om økonomi: for at kunne arbejde med data i en VDI-løsning skal den bestykkes med apps, og de kræver licenser. 
Bit rot i forbindelse med langtidsbevaring i ERDA og SIF blev diskuteret. P.t. bliver diskussionen om langtidsopbevaring generelt undgået, men Danmarks Statistik kunne være et sted at kigge hen. 
Mht. studerendes data vil AU ikke tage ansvaret og det skal derfor ikke i ERDA eller SIF. Zenodo er et alternativ.

Dataverse: medlemmerne efterlyste mere information, så de kan forberede forskerne. 
DMPOnline: KB har tilbudt at ligge flere skabeloner op, og ønsker en arbejdsgruppe nedsat for at få indsigt i AUs ønsker og behov. Behov vil variere hen over organisationen og afhængig af datas karakter, men BCD har tidligere lavet en model for ARTS DMP, som fokuserede på processen. 
DPO afviste modellen, da den ikke virkede med dataklassifikationen. I klassifikationen eskaleres beskyttelses-kravet afhængig af økonomi (dvs. alle store projekter vil skulle i SIF). OS kontoret, DPO og ISC er enige om at det skal ændres, men mangler en UL beslutning. 
Kompetenceudvikling blandt forskerne, evt. hackerthons eller workshops, blev diskuteret, men afventer at systemer til storage er klar. BCD foreslog det som tema i marts. 

Rådgivende forum: BCD gennemgik status. 
Det vigtigste er opdatering af WAYF-strukturen. 
Derudover er der et forsøg på at bruge DeiC til seed money for deling nedefra, men DeiC er ikke entusiastiske. 
Ifm. punkt 4 er der en høring i gang om ny bekendtgørelse om DeiC for at skabe klarhed om deres mandat. Rollefordelingen er i udvalg med et punkt om SIF for forskningsstruktur. Forskningsstyrelsen mangler at kvalificere bekendtgørelsen. CVR-mæssigt vil DeiC stadig være en del af DTU. 

Medlemmerne nævnte tre ting hver, under overskriften kurser og kompetenceudvikling:
JGH: 1) Train the trainer på fakultets-niveau for at afdække netværk 2) Roadmap for udrulning 3) Uddannelse af lederne for at sikre deres støtte.
RH: Hvordan får man fat i professorerne? Her kunne små, åbne, hands on workshops virke. 
PMD: 1) Definition af ansvarsområder på AU; hvornår kan man bruge DPO, hvornår TTO osv. 2) Samlet introduktion til dataflow 3) Kursus i ophavsret. 
ASH: 1) Hvad er DM bredt set 2) BSS skal etablere en organisation omkring DM, og det vil muligvis kræve involvering af en stærkere gruppe. DM på BSS ligger i de lokale forskningsmiljøer.
Gruppen gennemgik forskellige kilder omkring FAIRificering og DM: use cases fra Tech på Zenodo, eksempler fra HUM, rapport om data stewards skills. 

KKK fremlagde præsentation fra KB.
For KB hører Dataverse under datamanagement, og de forventer tilknyttede aktiviteter. 
Ift. fagspecialisterne har KB en rolle som struktur-specialister: de fokuserer på AUs politik og på hvordan man finder den information man mangler.

Emnet for næste møde bliver kompetenceudvikling og kurser, da gruppen ikke nåede at diskutere det ved dette møde.

Action liste:
Der ønskes eksempler på materiale, som viser fordelene ved FAIR. 
KKK sender invitationen til Dataverse zoom til gruppen. 
SMW retter det sidste referat til at vise at KKK ikke udeblev. 
Medlemmerne melder hvilke mailadresser de vil bruge til kontakt til SMW, som tilføjer dem online.
BCD sender La Roche EOSC-konference til deling. 
SMW snakker med ERDA SIF gruppen om planer for langtidsopbevaring.