Blog

Nyheder på sprogteknologi.dk

Nyt speciale sammenligner kvaliteten af oversættelsesværktøjer til og fra dansk

10. juni 2022

Mange af os er efterhånden blevet ganske gode til at bruge nogle af de mange forskellige oversættelsesprogrammer på markedet. Men hvor godt oversætter diverse oversættelsesværktøjer egentligt mellem dansk og engelsk? Oversættelsesværktøjer er hovedfokus i et nyt speciale udarbejdet af Jakob Blaaholm Nielsen, tidligere studerende ved IT & Cognition ved Københavns Universitet. I specialet...

Læs hele nyheden

I dag er Det Centrale Ordregisters indeks lanceret

30. maj 2022

Udviklingen af Centralt Ordregister for dansk (COR) er et samarbejdsprojekt mellem Det Danske Sprog- og Litteraturselskab, Dansk Sprognævn, Center for Sprogteknologi på KU og Digitaliseringsstyrelsen om at udvikle en dansk sprogressource til AI-formål. I dag er den formelle specifikation for COR-rammeværket, altså indekseringen i registeret, lanceret og gjort tilgængeligt. COR er et...

Læs hele nyheden

Ny rapport tegner lysere fremtidsudsigter for dansk sprogteknologi

3. maj 2022

European Language Equality er et EU-projekt, som arbejder for at skabe sprogteknologisk lighed mellem de europæiske sprog. Dette for at mindske sprogbarrierer, for at sikre lige digitaliseringsmuligheder og anvendelse af ny teknologi, fx AI. Som en del af indsatsen er der gennemført en indsamling af status på den sprogteknologiske tilstand for de europæiske sprog. Resultaterne er nu...

Læs hele nyheden

Digitaliseringsstyrelsen udgiver anbefalede standarder for sprogressourcer

8. marts 2022

Digitaliseringsstyrelsen har udarbejdet en række anbefalede standarder for danske sprogressourcer. Standarderne kan bidrage til, at danske sprogressourcer får ensartede formater og bliver endnu mere transparente. På den måde kan danske sprogressourcer få endnu mere værdi for dansk sprogteknologi. Der er fx givet anbefalinger for, hvilket format man bør gemme sprogressourcer i, hvordan data bør...

Læs hele nyheden

Nota vil bruge digitale assistenter til at øge digital inklusion

17. januar 2022

Sprogteknologi har et enormt potentiale for at udvide den digital inklusion og forøge livskvaliteten for mennesker, som har brug for hjælpemidler, fx blinde og personer med nedsat syn. Institutionen Nota har øjnet en mulighed for at højne serviceniveauet ved brug af sprogteknologiske løsninger, hvilket kan forøge livskvaliteten for deres anvendere. Det har affødt en række spændende projekter....

Læs hele nyheden

Nye sprogmodeller kan nu tilgås via sprogteknologi.dk

10. december 2021

Nedenfor får du et overblik over nogle af de seneste tilføjelser: Alvenir open-sourcer ny wac2vec model I sidste uge lancerede den nyopstartede virksomhed, Alvenir, en splinterny wav2vec model, som kan bruges til at udvikle taleteknologi med. Modellen er trænet på omtrent 1300 timers lyddata fra podcasts og lydbøger. Folkene bag Alvenir er langt fra ukendte inden for dansk sprogteknologi og...

Læs hele nyheden

Sprogteknologisk konference afholdt: Dansk sprogteknologi styrket af open source og lettere adgang til flere data

19. november 2021

Det var en bred skare af sprogteknologientusiaster, der i tirsdags stimlede sammen til en hel dag dedikeret til dansk sprogteknologi. Her får du et hurtigt tilbageblik. Nederst i artiklen kan du også finde PowerPoints fra konferencen. Der var lagt et stramt program fra kl. 09:00 – 15:50 med oplæg fra forskere, sprogteknologiske virksomheder, offentlige organisationer og EU. Fremmødet var...

Læs hele nyheden

Kom med input til dine foretrukne formater og standarder

8. november 2021

Hvilke formater og standarder foretrækker du at arbejde med? Det vil vi meget gerne have brugernes input til i forbindelse med sprogteknologi.dk’s kommende anbefalinger til formater og standarder. På sprogteknologi.dk vil vi gerne kunne oplyse dataudgivere om hvilke formater, det er mest hensigtsmæssigt at sprogdatasæt bliver udgivet i, så de er mest muligt anvendelige for dataanvenderne, fx...

Læs hele nyheden

Program for Sprogteknologisk konference d. 16. november 2021

26. oktober 2021

Center for Sprogteknologi ved Institut for Nordiske Studier og Sprogvidenskab, KU og Digitaliseringsstyrelsen er værter for konferencen om sprogteknologi som det udvikler sig lige nu i Danmark og i det europæiske miljø. Formålet med dagen er at samle relevante udviklere, brugere, forskere og studerende til en spændende dag, hvor vi udveksler viden om den aktuelle status på dansk sprogteknologi...

Læs hele nyheden

Nu er det tid til at bidrage til dansk Common Voice talekorpus

30. september 2021

Non-profit organisationen Mozilla forsøger at crowdsource et talekorpus for en række sprog, herunder også dansk. Du kan bidrage til det danske talekorpus, ved at donere din stemme eller validere optagne stemmer. Common Voice projektet forsøger at opbygge et talekorpus med hjælp fra ildsjæle og communities. Mozilla står for at facilitere, indsamle og strukturere data. Det hårde benarbejde har...

Læs hele nyheden

Nye værktøjer og modeller kan nu tilgås fra sprogteknologi.dk

8. september 2021

Udviklingen af sprogteknologiske værktøjer og modeller for dansk er inde i en god stime Nye værktøjer og modeller bidrager til udviklingen af dansk sprogtek-nologi, da de åbner nye muligheder for, hvordan vi arbejder med teknologi til at bearbejde det skrevne eller talte sprog. Sprogteknologi.dk giver her et kort over-blik over de senest tilføjede sprogteknologiske værktøjer. RøBÆRTa, Attack...

Læs hele nyheden

Få inspiration til talegenkendelse med nyt katalog

8. juli 2021

I år er der igangsat et signaturprojekt, som særligt arbejder med udvikling og brug af talegenkendelse på dansk.  De første erfaringer fra projektet er nu samlet og offentliggjort i et inspirationskatalog. Forhåbentligt kan det skabe interesse for og viden om anvendelsesmulighederne af sprogteknologi.  Signaturprojektet ”Digital inklusion og support ved talegenkendelse" I 2021 blev...

Læs hele nyheden

Save the date - Sprogteknologisk konference d.16 november!

5. juli 2021

Sæt kryds i din kalender d.16 november 2021. Digitaliseringsstyrelsen og Center for Sprogteknologi ved Københavns Universitet inviterer til dansk sprogteknologisk konference. Programmet er pakket med spændene oplæg af forskellig karakter og henvender sig til brugere, udviklere, forskere og studerende, som arbejder eller ønsker at arbejde med sprogteknologi. Hvor formiddagen fokuserer på...

Læs hele nyheden

Få seneste nyt fra sprogteknologi.dk automatisk på LinkedIn

22. juni 2021

Hvis du vil holde dig opdateret med, hvornår vi gør nye sprogdata og sprogres-sourcer tilgængelige hér på sprogteknologi.dk samt følge med i andre nyheder inden for sprogteknologi, så kan du nu få nyhederne direkte i dit feed på LinkedIn ved at følge vores nye showcase-side. Formålet med showcase-siden på LinkedIn er at skabe et sprogteknologisk forum, der kan danne rammen for et netværk med...

Læs hele nyheden

Danish Gigaword Project - et historisk stort dansk tekstkorpus

7. juni 2021

Danish Gigaword Project har i næsten 2 år knoklet med at udarbejde et stort dansk tekstkorpus.  Nu er korpusset endelig udgivet, og det giver god grund til begejstring for de danske sprogteknologiske miljøer. Gigaword er nemlig, med over én milliard danske ord, et korpus af historisk stor størrelse. En velkendt udfordring er, at fordi der er færre, som taler dansk på verdensplan, så er mængden...

Læs hele nyheden

ÆLÆCTRA og NERDA – To nye sprogteknologiske værktøjer, der forstår dansk

19. maj 2021

Det er ikke nogen hemmelighed, at udviklingen af sprogteknologi på dansk ikke er lige så nem som på de store sprog, fx engelsk eller kinesisk, hvor mængden af let tilgængelige sprogressourcer muliggør udvikling med speederen i bund. Manglende dansk sprogteknologi er desværre en unødig barriere for et digitalt Danmark af høj kvalitet og for udnyttelsen af det massive potentiale i nye...

Læs hele nyheden

OPDATERET: Vellykket markedsdialog om et dansksproget talekorpus

12. maj 2021

Opdatering: Udbud af et dansksproget talekorpus gennemføres ikke. Digitaliseringsstyrelsen har besluttet ikke at gennemføre udbuddet vedrørende et dansksproget tidskodet og transskriberet talekorpus og undersøger i øjeblikket andre muligheder for at tilvejebringe et talekorpus.    Digitaliseringsstyrelsen gennemførte i november 2020 en markedsdialog, hvor alle interesserede parter havde...

Læs hele nyheden

A hva for nåed? - Ny bog giver grundig introduktion til dansk fonetik

15. april 2021

15. januar 2021 udgav Samfundslitteratur bogen ”Udtalt: En introduktion til dansk fonetik”, som er skrevet af et hold sprogeksperter fra Københavns Universitet: Jan Heegård Petersen, Holger Juul, Nicolai Pharao og Marie Maegaard.  I bogen behandles en lang række emner om det talte sprog på dansk, fx hvordan lydende frembringes, hvordan lydbølgerne ser ud, hvordan forandres lyde i...

Læs hele nyheden

Udarbejdelsen af et centralt ordregister skydes i gang

14. marts 2021

Vi kan nu glædeligt meddele, at udviklingen af et Central Ordregister for dansk (COR) sættes i gang. COR kan bidrage til at gøre løsninger, som involverer kunstig intelligens mere relevante ved at skabe bedre forudsætninger for, at computere kan lære at forstå den betydning mennesker tilskriver ord. COR er en investering i fremtidens danske AI-udvikling, da den strukturerede...

Læs hele nyheden

Lær en computer at genkende følelser med Angry Tweets

26. november 2020

Alexandra Instituttet har lavet et spil der skal lære en computer at genkende følelser. Angry Tweets er et lille crowdsourcing-spil med det formål, at alle kan hjælpe til med udviklingen af sprogteknologi på dansk .  Du støder tit på sprogteknologi i din hverdag, selvom du måske ikke tænker over det - det kan være når du skriver en sms, og din mobil foreslår det næste ord, du skal til at...

Læs hele nyheden

Markedsdialog om udviklingen af et dansksproget talekorpus

2. november 2020

For at understøtte udviklingen af bedre talegenkendelse på dansk inviterer Digitaliseringsstyrelsen i de kommende uger interesserede parter til en markedsdialog med henblik på at kvalificere udformningen af en udviklingsopgave af et stort dansksproget transskriberet og tidskodet talekorpus. Opgaven forventes at blive sendt i udbud primo 2021.   Der er stor efterspørgsel i de sprogteknologiske...

Læs hele nyheden