Første udgivelse af data til træning af danske sprogmodeller
13. januar 2026
Digitaliseringsstyrelsen, Rigsarkivet og Det Kgl. Bibliotek har netop frigivet den første mængde af tekstdata, som kan anvendes til træning af danske sprogmodeller. Der...
Læs mere
Det har Sprogteknologi.dk lavet i 2025!
18. december 2025
År 2025 går på hæld, og det samme gør det syvende år, hvor Digitaliseringsstyrelsen har arbejdet med det nationale initiativ sprogteknologi.dk. Vi vil...
Læs mere
Workshop om behovet for data til sprogteknologiske løsninger
11. december 2025
Efterspørgslen på data til sprogteknologiske løsninger handler ikke alene om adgangen til data, men også om de rammer og forudsætninger, som gør, at...
Læs merePå sprogteknologi.dk finder du 210 sprogressourcer fra 42 forskellige organisationer. Hvis du nemt vil udstille dine metadata om en sprogressource og samtidig være med til at fremme arbejdet for at mindske barriererne for udvikling af danske sprogteknologiske løsninger, kan du også få dine metadata på sprogteknologi.dk
Optagelse i katalogetFølg sprogteknologi.dk på LinkedIn og hold dig opdateret om nye sprogressourcer på portalen og andre nyheder inden for sprogteknologi.
- Statslige Digitale Publikationer - træningsdata 12. januar 2026
- Danmarks Breve - træningsdata 12. januar 2026
- OS2KLE 31. oktober 2025
- Danish Dynaword 21. august 2025
- CoRal - Danish Conversational and Read-aloud Dataset - version 2 3. juli 2025
- Donér din stemme taledatasæt 27. juni 2025
- Historical Danish Handwriting 25. april 2025
- Fineweb-2 5. februar 2025
- Fineweb-c 5. februar 2025
- Synthetic from Text Matching Short Tasks Danish 28. januar 2025
- Synthetic from Text Matching Long Tasks Danish 28. januar 2025
- Synthetic from Unit Triple Tasks Danish 28. januar 2025