Datakvalitet

Løbende oprydning i stamdata

Aarhus Universitet har brugt Pure i over 15 år. I al den tid har forskere, sekretærer og andre med Pure-adgang haft mulighed for at oprette stamdata. Stamdata er f.eks. eksterne organisationer, tidsskrifter og forlag. Stamdata er fundamentet for god datakvalitet og for nem registrering af publikationer og aktiviteter. God datakvalitet er en forudsætning for at kunne lave analyser af publiceringskanaler, samarbejdspartnere og meget mere.

Der er gennem tiden blevet oprettet store mængder stamdata, til dels af ret lav kvalitet, som både gør det sværere at registrere, men også at analysere førnævnte sammenhænge. Se eksemplet til højre, hvor en søgning på eksterne organisationer  "Oxford University" giver flere dårlige resultater. Det ses bl.a. i form af 'klumper' - dvs. flere organisationer sat sammen i én organisation. Dermed kan man f.eks. ikke måle på, hvor mange gange, AU har sampubliceret med University of Oxford. Et andet eksempel er det nederste , hvor den eksterne organisation er en 'fritekst'-beskrivelse af en aktivitet. Denne aktivitet står nu i Pure som en ekstern organisation.

Det er bl.a. organisationer som disse, som Pure-teamet er gået i gang med at rydde op i. Det skal gøre det nemmere at registrere publikationer, aktiviteter, osv., men også gøre det muligt at lave valide og gode analyser. Vi koncentrerer indsatsen omkring oprydning  af eksterne organisationer og tidsskrifter og på sigt også forlag.

Det kan resultere i, at nogle oplysninger på dine publikationer, aktiviteteter, etc. ændrer sig. Hvis du oplever at vigtig information forsvinder, kan du indtaste dette i fritekstfelter eller kontakte Pure-teamet for en snak om, hvad der skal ske med den enkelte registrering.

Nedenfor kan du læse mere om, hvordan du kan understøtte god datakvalitet, samt hvad vores oprydningsarbejde kan betyde for dit indhold.

Når du registrerer en aktivitet

Meget af den dårlige datakvalitet stammer fra aktiviteter. Her bliver man mødt af et krav om at tilføje en type af stamdata, hvilket ikke nødvendigvis giver mening til den enkelte aktivitet. 

F.eks. hvis du vil registrere, at du har været del af et Ph.d.-bedømmelsesudvalg. Her bliver du bedt om at vælge en Begivenhed, Organisation eller Ekstern organisation. Dét, du vælger, bliver titlen på din aktivitet. Det er derfor nærliggende at oprette en ny ekstern organisation for hvert bedømmelsesudvalg, man deltager i. Men disse felter er ikke fritekstfelter.

Dette er et stort problem for datakvaliteten og gør registrering af eksterne organisationer sværere andre steder. 


For at løse disse problemer har vi lavet samleorganisationer for flere typer af bedømmelsesudvalg - se billedet til højre for eksempler. Læg mærke til, at der i bunden af hver organisation står "Midlertidig organisation". Det beskriver udvalgets midlertidige karakter, ikke organisationens registrering i Pure. Det er samtidig et stærkt indikativ på, at det er en organisation oprettet centralt af Pure teamet. Disse samleorganisationer bruges vi som udgangspunkt til bagudrettet oprydning.

Fremadrettet skal du dog ikke vælge denne samleorganisation. Vælg i stedet for en eksisterende organisation som f.eks. University of Oxford. Derefter kan du beskrive bedømmelsesudvalget i fritekstfeltet "Beskrivelse". Du kan selvfølgelig også tilføje personer og organisationer under "Personer/Organisationer".

Husk i øvrigt altid at udfylde "Oplysninger om bibeskæftigelse".

Når du registrerer en publikation

På Aarhus Universitet arbejder forskere og medarbejdere sammen med alverdens universiteter, hospitaler, NGO'er, osv. For at vi meningsfuldt kan analysere på det, er vi nødt til at fokusere på moderorganisationer, dvs. den overordnede enhed. 

På de fleste publikationer er forfatternes affilliering ikke kun til f.eks. et universitet, men også en afdeling, center eller måske et specifikt laboratorie. Den detajleringsgrad kan vi ikke understøtte organisatorisk eller analytisk. Derfor indtastes 'kun' universitetet, hospitalet eller hvad der nu er tilfældet. 

Hvis en forfatter har mere end én affiliering skrives disse ikke sammen i en 'klump'. De skal tilføjes som forskellige organisationer. 

Tidsskrifter og bogserier

Vi opbevarer som udgangspunkt ikke tidsskrifter og bogserier uden ISSN-nummer. Hvis du ikke kan finde den bogserie eller det tidsskrift, du har publiceret i, kan du vælge at oprette et nyt. Husk at tilknytte et ISSN-nummer. Er du i tvivl, kan du tilføje samle-tidsskriftet "Ikke-valideret tidsskrift". Tidsskriftet tjekkes i forbindelse med Pure teamets validering af publikationer.

Konsekvenser for dit indhold

Aktiviteter

Som nævnt under "Når du registrerer en aktivitet" oprettes der løbende samlekategorier for eksterne organisationer, vi ikke kan validere og vedligeholde som enkeltstående organisation - f.eks. bedømmelsesudvalg. Det har konsekvenser for både informationsmængden og visning på hjemmesiden.

Der er en risiko for, at væsentlige detaljer går tabt, hvis de ikke var gemt andre steder på publikationen. Det kan f.eks. være i form af en organisation kaldet "Medlem af Ph.d.-bedømmelsesudvalg v. University of Oxford". Her forsvinder informationen om, at det foregik på Oxford. Det er en konsekvens af forkert brug af stamdata, som er beklagelig. Brug fritekst til alt, der ikke er stamdata.

Samleorganisationerne giver også en mindre detaljeret visning på hjemmesiden, som eksemplificeret på billedet til højre. Det vil også gøre sig gældende ved f.eks. redaktør-aktiviteter på tidsskrifter, der bliver lagt over på "Ikke-valideret tidsskrift"-samletidsskriftet. Det skyldes, at organisationen/tidsskriftet bliver brugt som titel. Vi er i dialog med leverandøren af systemet omkring at få mulighed for at vælge en titel på disse aktiviteter, som kan bruges til bedre visning.

Publikationer

I den løbende oprydning af tidsskrifter og bogserier vil nogle tidsskrifter/bogserier, der enten er udgået eller umulige at validere, blive slettet eller ændret til et samle-tidsskrift kaldet "Ikke-valideret tidsskrift". Det vises, når du åbner publikationen i Pure portalen.

På flere publikationer vil affilieringer, særligt på eksterne forfattere, ændre sig eller forsvinde helt. Det sker oftest på ældre publikationer. Affilieringerne er kun synligt i backend og bruges udelukkende til analyser af samarbejde.