XLS-R-300m-danish-nst-cv9

'Finetuned version af XLS-R-300m-danish til talegenkendelse på dansk.

Modellen er finetuned på træningssættet af NST ASR og Common Voice 9, og har en word error rate på 5-10% på på tværs af Alvenir, NST og Common Voice 9 test sættene. Modellen performer omtrent 20% bedre end XLS-R og 50% bedre end wav2vec-base-da finetuned på samme datasæt.

Modellen er trænet af Lasse Hansen ved (Center for Humanities Computing ved Aarhus Universitet) i samarbejde med Alvenir.

Data og Distribution(er)

Yderligere info test

Felt Værdi
Destinationsside https://huggingface.co/chcaa/xls-r-300m-danish-nst-cv9
Metadata sidst opdateret januar 19, 2023, 11:30 (UTC)
Metadata oprettet august 18, 2022, 13:05 (UTC)
Emne Sprog og retskrivning Uddannelse, kultur og sport
Kontaktemail chcaa@cas.au.dk
Kontaktnavn Lasse Hansen
Opdateret 2022-08-15
Skaber Lasse Hansen & Alvenir
Sprog dansk
URI https://data.gov.dk/dataset/lang/8b0f2a68-2016-4624-8027-1bd5a88a4104
Udgivelsesdato 2022-08-15
Udgivernavn Center for Humanities Computing Aarhus
Dokumentation