Blog

Nyheder på sprogteknologi.dk

Nota vil bruge digitale assistenter til at øge digital inklusion

17. januar 2022

Sprogteknologi har et enormt potentiale for at udvide den digital inklusion og forøge livskvaliteten for mennesker, som har brug for hjælpemidler, fx blinde og personer med nedsat syn. Institutionen Nota har øjnet en mulighed for at højne serviceniveauet ved brug af sprogteknologiske løsninger, hvilket kan forøge livskvaliteten for deres anvendere. Det har affødt en række spændende projekter....

Læs hele nyheden

Nye sprogmodeller kan nu tilgås via sprogteknologi.dk

10. december 2021

Nedenfor får du et overblik over nogle af de seneste tilføjelser: Alvenir open-sourcer ny wac2vec model I sidste uge lancerede den nyopstartede virksomhed, Alvenir, en splinterny wav2vec model, som kan bruges til at udvikle taleteknologi med. Modellen er trænet på omtrent 1300 timers lyddata fra podcasts og lydbøger. Folkene bag Alvenir er langt fra ukendte inden for dansk sprogteknologi og...

Læs hele nyheden

Sprogteknologisk konference afholdt: Dansk sprogteknologi styrket af open source og lettere adgang til flere data

19. november 2021

Det var en bred skare af sprogteknologientusiaster, der i tirsdags stimlede sammen til en hel dag dedikeret til dansk sprogteknologi. Her får du et hurtigt tilbageblik. Nederst i artiklen kan du også finde PowerPoints fra konferencen. Der var lagt et stramt program fra kl. 09:00 – 15:50 med oplæg fra forskere, sprogteknologiske virksomheder, offentlige organisationer og EU. Fremmødet var...

Læs hele nyheden

Kom med input til dine foretrukne formater og standarder

8. november 2021

Hvilke formater og standarder foretrækker du at arbejde med? Det vil vi meget gerne have brugernes input til i forbindelse med sprogteknologi.dk’s kommende anbefalinger til formater og standarder. På sprogteknologi.dk vil vi gerne kunne oplyse dataudgivere om hvilke formater, det er mest hensigtsmæssigt at sprogdatasæt bliver udgivet i, så de er mest muligt anvendelige for dataanvenderne, fx...

Læs hele nyheden

Program for Sprogteknologisk konference d. 16. november 2021

26. oktober 2021

Center for Sprogteknologi ved Institut for Nordiske Studier og Sprogvidenskab, KU og Digitaliseringsstyrelsen er værter for konferencen om sprogteknologi som det udvikler sig lige nu i Danmark og i det europæiske miljø. Formålet med dagen er at samle relevante udviklere, brugere, forskere og studerende til en spændende dag, hvor vi udveksler viden om den aktuelle status på dansk sprogteknologi...

Læs hele nyheden

Nu er det tid til at bidrage til dansk Common Voice talekorpus

30. september 2021

Non-profit organisationen Mozilla forsøger at crowdsource et talekorpus for en række sprog, herunder også dansk. Du kan bidrage til det danske talekorpus, ved at donere din stemme eller validere optagne stemmer. Common Voice projektet forsøger at opbygge et talekorpus med hjælp fra ildsjæle og communities. Mozilla står for at facilitere, indsamle og strukturere data. Det hårde benarbejde har...

Læs hele nyheden

Nye værktøjer og modeller kan nu tilgås fra sprogteknologi.dk

8. september 2021

Udviklingen af sprogteknologiske værktøjer og modeller for dansk er inde i en god stime Nye værktøjer og modeller bidrager til udviklingen af dansk sprogtek-nologi, da de åbner nye muligheder for, hvordan vi arbejder med teknologi til at bearbejde det skrevne eller talte sprog. Sprogteknologi.dk giver her et kort over-blik over de senest tilføjede sprogteknologiske værktøjer. RøBÆRTa, Attack...

Læs hele nyheden

Få inspiration til talegenkendelse med nyt katalog

8. juli 2021

I år er der igangsat et signaturprojekt, som særligt arbejder med udvikling og brug af talegenkendelse på dansk.  De første erfaringer fra projektet er nu samlet og offentliggjort i et inspirationskatalog. Forhåbentligt kan det skabe interesse for og viden om anvendelsesmulighederne af sprogteknologi.  Signaturprojektet ”Digital inklusion og support ved talegenkendelse" I 2021 blev...

Læs hele nyheden

Save the date - Sprogteknologisk konference d.16 november!

5. juli 2021

Sæt kryds i din kalender d.16 november 2021. Digitaliseringsstyrelsen og Center for Sprogteknologi ved Københavns Universitet inviterer til dansk sprogteknologisk konference. Programmet er pakket med spændene oplæg af forskellig karakter og henvender sig til brugere, udviklere, forskere og studerende, som arbejder eller ønsker at arbejde med sprogteknologi. Hvor formiddagen fokuserer på...

Læs hele nyheden

Få seneste nyt fra sprogteknologi.dk automatisk på LinkedIn

22. juni 2021

Hvis du vil holde dig opdateret med, hvornår vi gør nye sprogdata og sprogres-sourcer tilgængelige hér på sprogteknologi.dk samt følge med i andre nyheder inden for sprogteknologi, så kan du nu få nyhederne direkte i dit feed på LinkedIn ved at følge vores nye showcase-side. Formålet med showcase-siden på LinkedIn er at skabe et sprogteknologisk forum, der kan danne rammen for et netværk med...

Læs hele nyheden

Danish Gigaword Project - et historisk stort dansk tekstkorpus

7. juni 2021

Danish Gigaword Project har i næsten 2 år knoklet med at udarbejde et stort dansk tekstkorpus.  Nu er korpusset endelig udgivet, og det giver god grund til begejstring for de danske sprogteknologiske miljøer. Gigaword er nemlig, med over én milliard danske ord, et korpus af historisk stor størrelse. En velkendt udfordring er, at fordi der er færre, som taler dansk på verdensplan, så er mængden...

Læs hele nyheden

ÆLÆCTRA og NERDA – To nye sprogteknologiske værktøjer, der forstår dansk

19. maj 2021

Det er ikke nogen hemmelighed, at udviklingen af sprogteknologi på dansk ikke er lige så nem som på de store sprog, fx engelsk eller kinesisk, hvor mængden af let tilgængelige sprogressourcer muliggør udvikling med speederen i bund. Manglende dansk sprogteknologi er desværre en unødig barriere for et digitalt Danmark af høj kvalitet og for udnyttelsen af det massive potentiale i nye...

Læs hele nyheden

OPDATERET: Vellykket markedsdialog om et dansksproget talekorpus

12. maj 2021

Opdatering: Udbud af et dansksproget talekorpus gennemføres ikke. Digitaliseringsstyrelsen har besluttet ikke at gennemføre udbuddet vedrørende et dansksproget tidskodet og transskriberet talekorpus og undersøger i øjeblikket andre muligheder for at tilvejebringe et talekorpus.    Digitaliseringsstyrelsen gennemførte i november 2020 en markedsdialog, hvor alle interesserede parter havde...

Læs hele nyheden

A hva for nåed? - Ny bog giver grundig introduktion til dansk fonetik

15. april 2021

15. januar 2021 udgav Samfundslitteratur bogen ”Udtalt: En introduktion til dansk fonetik”, som er skrevet af et hold sprogeksperter fra Københavns Universitet: Jan Heegård Petersen, Holger Juul, Nicolai Pharao og Marie Maegaard.  I bogen behandles en lang række emner om det talte sprog på dansk, fx hvordan lydende frembringes, hvordan lydbølgerne ser ud, hvordan forandres lyde i...

Læs hele nyheden

Udarbejdelsen af et centralt ordregister skydes i gang

14. marts 2021

Vi kan nu glædeligt meddele, at udviklingen af et Central Ordregister for dansk (COR) sættes i gang. COR kan bidrage til at gøre løsninger, som involverer kunstig intelligens mere relevante ved at skabe bedre forudsætninger for, at computere kan lære at forstå den betydning mennesker tilskriver ord. COR er en investering i fremtidens danske AI-udvikling, da den strukturerede...

Læs hele nyheden

Lær en computer at genkende følelser med Angry Tweets

26. november 2020

Alexandra Instituttet har lavet et spil der skal lære en computer at genkende følelser. Angry Tweets er et lille crowdsourcing-spil med det formål, at alle kan hjælpe til med udviklingen af sprogteknologi på dansk .  Du støder tit på sprogteknologi i din hverdag, selvom du måske ikke tænker over det - det kan være når du skriver en sms, og din mobil foreslår det næste ord, du skal til at...

Læs hele nyheden

Markedsdialog om udviklingen af et dansksproget talekorpus

2. november 2020

For at understøtte udviklingen af bedre talegenkendelse på dansk inviterer Digitaliseringsstyrelsen i de kommende uger interesserede parter til en markedsdialog med henblik på at kvalificere udformningen af en udviklingsopgave af et stort dansksproget transskriberet og tidskodet talekorpus. Opgaven forventes at blive sendt i udbud primo 2021.   Der er stor efterspørgsel i de sprogteknologiske...

Læs hele nyheden

Forbedring af eksisterende sprogressource (NST Danish ASR Database)

29. oktober 2020

Ny forbedret version af NST Danish ASR Database (16 kHz) på sprogteknologi.dk.  Språkbanken ved Nasjonalbiblioteket i Norge har netop publiceret en ny reorganiseret version af deres populære NST Danish ASR Database (16 kHz) til dansk talegenkendelse og diktering. I denne nye version er mappestrukturen mere brugervenlig og filerne har fået meningsbærende navne der er uafhængige af...

Læs hele nyheden

Lancering af sprogteknologi.dk

23. juni 2020

Stat, regioner og kommuner lancerer i dag den digitale platform ’sprogteknologi.dk’, der skal give let adgang til danske sprogressourcer og dermed understøtte udviklingen af kunstig intelligens på dansk. Indsatsen skal bidrage til at sikre, at det digitale sprog i Danmark er dansk. Initiativet er et samarbejde mellem staten, KL og Danske Regioner. Udviklingen af de forskellige former for...

Læs hele nyheden

spaCy - nu også med modeller på dansk

17. juni 2020

Software-virksomheden Explosion har bygget videre på en række danske sprogressourcer og tilbyder nu spaCy v2.3 med modeller for fem nye sprog – heriblandt dansk. Du kan finde metadata om de danske sprogressourcer hér på sprogteknologi.dk. Software-virksomheden Explosion har specialiseret sig i udviklingsværktøjer til understøttelse af kunstig intelligens og NLP (Natural Language Processing) og...

Læs hele nyheden

Gratis adgang for SMV'er til EU's eTranslation

16. juni 2020

EU-Kommissionen har gjort deres værktøj til automatiseret oversættelselse, eTranslation, tilgængelig for alle små og mellemstore virksomheder (SMV'er). eTranslation er gratis, sikkert og let at bruge. Dermed kan alle små og mellemstore danske virksomheder nu bruge eTranslation til at oversætte enhver tekst på en nem, gratis og sikker måde på alle 24 officielle EU-sprog samt islandsk, norsk og...

Læs hele nyheden