XLS-R-300m-danish

XLS-R-300m-danish er en general dansk talemodel der bygger på wav2vec2.0 arkitekturen og er en fortsat prætræning af XLS-R checkpointet. Modellen er trænet på 141.000 timers dansk tale fra DR P1 og Radio24syv, og kan finetunes til alle formål der indebærer analyse af dansk tale.

Efter finetuning performer modellen omtrent 20% bedre end XLS-R og 50% bedre end wav2vec2-base-da på dansk talegenkendelse. Klik her for at læse mere om den fintuned model.

Modellen er trænet af Lasse Hansen fra Center for Humanities Computing Aarhus i samarbejde med Alvenir på UCloud platformen.

Data og Distribution(er)

Yderligere info

Felt Værdi
Destinationsside https://huggingface.co/chcaa/xls-r-300m-danish
Metadata sidst opdateret december 7, 2022, 11:33 (UTC)
Metadata oprettet august 17, 2022, 11:55 (UTC)
Emne Sprog og retskrivning http://publications.europa.eu/resource/authority/data-theme/EDUC
Kontaktemail chcaa@cas.au.dk
Kontaktnavn Lasse Hansen
Opdateret 2022-08-15
Skaber Lasse Hansen & Alvenir
Sprog dansk
URI https://data.gov.dk/dataset/lang/523b01af-e39b-4cd1-ab73-33165724b338
Udgivelsesdato 2022-08-15
Udgivernavn Center for Humanities Computing Aarhus
Dokumentation