Tilgængelighed af tekster på Brightspace

Når du lægger tekster på Brightspace, så skal de være tilgængelige. Det betyder bl.a. at teksterne kan læses højt af den oplæsningssoftware, der bruges af studerende med ordblindhed/dysleksi og synshandicap - det følger af lov om Webtilgængelighed.  Se evt. mere om tilgængelighed i systemer på AU hjemmeside.

Når du scanner tekst fra bog/papir så gemmes scanningen som et digitalt billede. Sådanne billeder af tekst kan ikke læses af oplæsningssoftware. Tekster på Brightspace skal være marker- og kopierbare, og må ikke være gemt som et billede.

Sådan sikrer du tilgængelige tekster i Brightspace

Der er flere måder at sikre, at tekster på Brightspace kan læses af oplæsningssoftware.

  • Brug en original, digital og tilgængelig kopi af teksten. Dette er den enkleste og bedste måde, og det kan gøres ved:
    • At indsætte et direkte link til teksten/artiklen på fx Archives, Det Kgl. Bibliotek eller andre eksterne forskningsbiblioteker. Disse tekster vil ofte være tilgængelige.
    • At downloade en ”e-bog”/artikel fx i PDF-format fra forlaget eller fra fx Det Kgl. Bibliotek.
  • Brug HTML-formateret eller PDF-format. Hvis en oprindelig digital tekst enten er lagt op i HTML-format hos forlaget/biblioteket eller er gemt i PDF-format, bibeholdes det tilgængelige digitale format oftest, og den kan derfor umiddelbart oplæses. Med den originale digitale tekst opnås også den bedst mulige kvalitet for brugeren af oplæsningssoftware, da teksten ikke udsættes for de fejl, der kan opstå ved OCR behandling – se nedenfor.
  • Scan en papirbaseret tekst og konverter til tekstfil. Det er ofte ikke en optimal løsning, når en papirbaseret tekst scannes og efterfølgende konverteres til en tekstfil med en såkaldt OCR-software (Optical Character Recognition). Resultatet af dette vil altid give et ringere produkt for brugeren end den originale tekst. Dette skyldes at OCR behandlingen under den ”visuelle” konvertering af tekst/bogstaver på billedet er helt afhængig af både kvaliteten af kopien og layout og indhold i teksten.

Tjek om din tekst kan læses af oplæsningssoftware

Helt grundlæggende gælder det, at hvis din tekst kan markeres og kopieres, så kan den oplæses af oplæsningssoftware.

Hvis du har scannet en tekst og derefter OCR behandlet den scannede fil til et PDF-format, så bør du tjekke kvaliteten af OCR-behandlingen (læs mere nedenfor). Det gør du ved at kopiere teksten fra PDF-dokumentet til et Word-dokument. I Word kan du se den tekst der oplæses. Layoutet i Word vil ofte være forskellig fra PDF-filen, men det centrale er, at selve teksten er den samme. Er der fejl i teksten, skal disse rettes i OCR programmet under OCR-behandlingen eller evt. efterfølgende i samme program (læs mere nedenfor).

Vedrørende tekstens layout

OCR behandling af scannede tekster, fx prosa-tekster med ren tekst, giver et langt bedre produkt end når du scanner en tekst med et kompliceret layout, for eksempel hvor tekst, billeder, formler, matematiske tegn og skemaer m.m. blandes sammen. Nogle tekster vil reelt have et layout, hvor en tilfredsstillende OCR behandling ikke er mulig, og dermed ikke vil give en acceptabel oplæsning.

OCR behandling af en scannet tekst

For at sikre en god tekstgenkendelse skal den originale tekst du scanner være en ”ren tekst” uden overstregninger, noter m.m. Du skal også undgå mørke områder langs ”bogens ryg” ved indscanning.

Programmer:

Til OCR genkendelse findes der flere produkter, men du kan eksempelvis benytte:

  • Adobe Acrobat Pro, som alle AU ansatte har adgang til. Ved ”ren prosatekst” vil dette program måske være tilstrækkeligt for et acceptabelt resultat. I dette program er der nogle, men dog begrænsede, muligheder for at tilrette og forbedre OCR-behandlingen undervejs og efter indscanning.
  • ABBYY FineReader Pro. Dette er ofte et bedre alternativ end Adobe Acrobat Pro, da du under OCR behandlingen i højere grad kan optimere kvaliteten ved fx at udvælge de ovennævnte problematiske tekstdele som fx matematiske formler og bibeholde dem som ”billeder”. Disse kan ganske vist ikke oplæses, men de bliver heller ikke oplæst forkert som konsekvens af en ellers forkert OCR-genkendelse.

Vejledning til OCR behandling

 www.ordlab.dk, ligger små videovejledninger om bl.a. oplæsningsprogrammer samt om indskanning og brug af ABBYY FineReader Pro. Alle ansatte og studerende på AU har adgang til Ordlab via WAYF. 


Log ind via nedenstående link og læs bl.a. om det oplæsningsprogram og det OCR program som ordblinde studerende får bevilget, hvis de får SPS-støtte:

Vejledning i OCR behandling i Adobe Acrobat Pro

Opmærksomhed på scanning på kopimaskine

Et uddrag af en bog eller en artikel kan scannes til et PDF-dokument på de fleste kopimaskiner. Her vil den typisk være i ”billedformat”, hvor teksten ikke kan markeres og dermed ikke er tilgængelig. Brug en bog/artikel uden overstregninger/notater i teksten og undgå evt. ”mørke felter” ved bogens ryg. En god kopi er en forudsætning for et god OCR-behandling og et brugbart resultat.

Nogle kopimaskiner vil med et tillægsprogram kunne OCR-behandle scannet tekst under kopieringsprocessen – altså konvertere filen fra billedformat til søgbart tekstformat. En sådan OCR-behandlet tekst skal gennemgås for fejl, og nedenstående proces kan måske forbedre resultatet.

Vejledning til OCR-behandling

Alle AU-medarbejdere har adgang til Adobe Acrobat Pro DC, da den bliver installeret som et standardprogram til håndtering/visning af PDF-dokumenter.

Det indscannede PDF-dokument kan efterfølgende OCR-behandles og dermed gøres marker- og søgbart. Det kan gøres på to måder når det åbnes i Adobe Acrobat Pro DC:

Til PDF:

  1. Vælg fanen Værktøjer → Rediger PDF → Filen OCR-behandles/konverteres nu fra billede til tekst, der kan markeres. Derudover får du mulighed for at redigere det konverterede tekst, hvilket oftest er nødvendigt, da der tit opstår genkendelsesfejl. Gem derefter dokumentet, som nu er tilgængeligt og markerbart.

Fordelen ved denne metode er, at filen beholdes som PDF-format, og at det er muligt at redigere teksten undervejs i processen. PDF-dokumentet er efterfølgende næsten visuelt identisk med originalen, da billedlaget med ændringer er synligt som et lag foran den redigerede tekst.

Ulempen er, at eventuelle ændringer i den konverterede tekst kan give flere lag, der kan dække over hinanden, hvilket man må være opmærksom på i processen. Læs her mere om redigering af scannede dokumenter

Til Word:

  1. Vælg fanen Filer → Eksporter til → Microsoft Word → Word Dokument → Filen OCR-behandles/konverteres til et Word dokument. Konverteringen kan dog være forkert, og dokumentet kræver en gennemlæsning med bl.a. stavekontrol, så fejl i teksten kan rettes til.  

Fordelen ved denne metode er, at teksten er i Word, og at teksten helt synlig kan redigeres umiddelbart, og senere igen af studerende. Evt. ikke korrigerede konverteringsfejl vil være synlige for studerende.

Ulempen er, at Word modsat PDF-formatet kun kan håndtere ”ét lag” hvorved billedlaget fra kopimaskinen udelades og layoutet derfor bliver anderledes end det originale.

Anden vejledning

Adobe Acrobat Pro DC er mest velegnet til layoutmæssigt ”enkle” og ”prosaagtige” tekstfiler, da tekster med sammenblanding af tekst, billeder, formler, matematiske tegn og tabeller m.m. kan give mange konverteringsfejl og et ikke brugbart resultat.  I disse tilfælde og til mere grundig bearbejdning af tekst anbefales det mere avancerede program Abbyy FineReader. Du kan se  videovejledninger til programmet via dette direkte link FineReader på Ordlab.  Du skal blot logge ind med dit WAYF-login.

På Ordlab.dk kan du desuden finde en lang række videovejledninger om programmer, hvoraf nogle bl.a. bruges af ordblinde studerende på AU.

CED-­support

For spørgsmål til funktionalitet eller tekniske problemer:

Åbningstider

  • Mandag-torsdag kl. 9:00-15:00
  • Fredag kl. 9:00-14:00