Udgiver

Aarhus Universitet

Et forskningsintensivt universitet, der stræber efter den højeste internationale kvalitet og udmærker sig ved at skabe værdi gennem viden, ny erkendelse og samarbejde -...

Læs mere

Datasæt

XLS-R-300m-danish

XLS-R-300m-danish er en general dansk talemodel der bygger på wav2vec2.0 arkitekturen og er en fortsat prætræning af XLS-R checkpointet. Modellen er trænet på 141.000 timers dansk tale fra DR P1 og Radio24syv, og kan finetunes til alle formål der indebærer analyse af dansk tale.

Efter finetuning performer modellen omtrent 20% bedre end XLS-R og 50% bedre end wav2vec2-base-da på dansk talegenkendelse. Klik her for at læse mere om den fintuned model.

Modellen er trænet af Lasse Hansen fra Center for Humanities Computing Aarhus i samarbejde med Alvenir på UCloud platformen.

Data og ressourcer

xls-r-300m-danish - BIN formathttp://publications.europa.eu/resource/authority/file-type/BIN
Tilgå ressourcen her.
Udforsk
- Gå til ressource

Nøgleord

Yderligere info

URI	https://data.gov.dk/dataset/lang/523b01af-e39b-4cd1-ab73-33165724b338
Destinationsside	https://huggingface.co/chcaa/xls-r-300m-danish
Høstes af Datavejviser
Udgivelsesdato	15-08-2022
Seneste ændringsdato
Opdateringsfrekvens	ubekendt
Dækningsperiode	/
Emne(r)	16.05.07 Sprog og retskrivning Uddannelse, kultur og sport
Adgangsrettigheder	offentlig
Overholder
Proveniensudsagn
Dokumentation	https://huggingface.co/chcaa/xls-r-300m-danish/blob/main/README.md