Coral tekst-til-tale datasæt

Datasættet består af oplæsninger fra to professionelle danske talere, en kvinde og en mand, som har indlæst cirka 24 timers dansk tale hver.

Datasættet er en del af CoRal-projektet(Danish Conversational and Read-aloud Speech Dataset), som er et bredt samarbejdsprojekt mellem Alexandra Instituttet, Datalogisk institut ved Københavns Universitet (DIKU), Alvenir og Cort. CoRal er finansieret og støttet af Digitaliseringsstyrelsen og Den Danske Innovationsfond.

Tekstdata er udvalgt af Alexandra Instituttet og består af sætninger fra lex.dk, sundhed.dk, borger.dk, navne på busstoppesteder og stationer, manuelt filtrerede Reddit-kommentarer samt datoer og tidspunkter.

Lyddata er optaget af den offentlige institution Nota, som er en del af Kulturministeriet.

Data og Distribution(er)

Yderligere info test

Felt Værdi
Destinationsside https://huggingface.co/datasets/alexandrainst/coral-tts
Version 1.0
Metadata sidst opdateret april 18, 2024, 11:26 (UTC)
Metadata oprettet april 18, 2024, 10:06 (UTC)
Emne Sprog og retskrivning Uddannelse, kultur og sport
GUID 4724db01-4792-4bdb-8721-797737fec4ed
Kontaktemail alexandra@alexandra.dk
Kontaktnavn Alexandra Instituttet
Opdateret 16-04-2024
Opdateringsfrekvens ["http://publications.europa.eu/resource/authority/frequency/IRREG"]
Provinence Datalogisk institut ved Københavns Univeristet (DIKU), Corti, Alvenir og Innovationsfonden
Publisher Alexandra Instituttet
Sprog dansk
URI https://data.gov.dk/dataset/lang/4724db01-4792-4bdb-8721-797737fec4ed
Udgivelsesdato 16-04-2024
Udgivernavn Alexandra Instituttet