Baggrund

Hvad er sprogteknologi.dk?

På billedet ses en grafisk illustration af det mulige indhold af en fælles dansk sprogressource. Overordnet set skal en fælles dansk sprogressource forstås som en struktureret samling af digitale datasæt (lyd, tekst, ord) til fri afbenyttelse. Den indeholder det talte sprog i form af fx lydfiler, stemme- og lydoptagelser, dialekter og transskriberede lydoptagelser. Den indeholder også det skrevne sprog som fx tekster, tekstkorpus, grammatikker og annoteret tekst. Endelig indeholder den ord- og termbaser som fx ord, ordklasser, ordbøger og faglige termbaser.

Den digitale platform sprogteknologi.dk samler metadata om danske sprogressourcer ét sted. Det primære formål er at understøtte udviklingen af kunstig intelligens på dansk og dermed bidrage til at sikre, at det digitale sprog i Danmark er dansk.

Platformen sprogteknologi.dk indeholder bl.a. metadata om tale- og tekstkorpora, ordbøger, termbaser, sprogteknologiske supportværktøjer og infrastrukturkomponenter. Den digitale platform vil løbende blive udbygget med nye metadata om relevante, eksisterende sprogressourcer. På sigt vil der desuden blive udviklet og udstillet nye sprogressourcer, som kan mindske barrierene og styrke udviklingen af sprogteknologiske løsninger til understøttelse af kunstig intelligens på dansk af høj kvalitet.

Sprogteknologi som talegenkendelse, tekstanalyse, sprogforståelse, mv., er i mange sammenhænge helt centrale teknologier for udviklingen af kunstig intelligens. Sprogteknologi til understøttelse af kunstig intelligens på dansk er et fagligt komplekst område, der kræver en høj grad af specialistviden samtidig med, at det har en meget bred anvendelses- og interessentflade blandt både offentlige myndigheder, forskere og private virksomheder. Dertil er det et område i konstant udvikling. Derfor har Digitaliseringsstyrelsen valgt en agil tilgang til udviklingen af sprogteknologi.dk. Arbejdsprogrammer vil trinvist blive specificeret, hvilket giver rum for læring undervejs samt muliggør løbende brugerinddragelse, der kan være med til at kvalificere og specificere de konkrete indsatser. Denne tilgang skal være med til at sikre, at indsatserne bliver tilpasset til brugernes aktuelle behov samt den teknologiske udvikling.

Der vil på siden løbende blive informeret om planerne for videreudviklingen af sprogteknologi.dk.

Det politiske afsæt for sprogteknologi.dk

Det politiske afsæt for sprogteknologi.dk findes i Digitaliseringspagten og Økonomiaftalerne for 2020 mellem Regeringen, KL og Danske Regioner, hvor det blev besluttet at igangsætte et fællesoffentligt samarbejde om udviklingen af en fælles digital dansk sprogressource. Arbejdet tager bl.a. udgangspunkt i nogle af de anbefalinger, som Sprogteknologiudvalget, nedsat af Dansk Sprognævn under Kulturministeriet, kom med i rapporten ’Dansk sprogteknologi i Verdensklasse’ i april 2019.

Governance

Den politiske forankring af sprogteknologi.dk er i ’Styregruppen for nye teknologier og bedre brug af data’, der består af en række statslige myndigheder, KL og Danske Regioner. Digitaliseringsstyrelsen varetager formandskabet for styregruppen, ligesom Digitaliseringsstyrelsen er sekretariat for sprogteknologi.dk. Til at bistå med fagteknisk sparring har Styregruppen desuden nedsat en følgegruppe bestående af fagtekniske eksperter inden for kunstig intelligens og sprogteknologi.

Navn Titel  Organisation
Bolette Sandford Pedersen Professor KU, Center for sprogteknologi
Anders Søgaard Professor KU, Datalogisk Insitut
Finn Aarup Nielsen Lektor DTU - Compute
Barbara Plank Lektor ITU
Peter Juel Henrichsen Seniorforsker Dansk Sprognævn
Marius Hartmann Chef for Datalab Erhvervsstyrelsen
Hege Morken Fromreide Data Scientist UFST
Joachim Eriksson Informationssarkitekt  KL
Jens Kjellerup Digitaliseringschef Ballerup Kommune
Michael Eriksen Benros Professor Rigshospitalet
Mikkel Høgenhaug Forretningsspecialist ATP