Nota lyd- og tekstdata

Datasættet indeholder både tekst- og taledata fra udvalgte dele af Nota's lydbogsbiblotek. Datasættet består af over 500 timers oplæsninger og medfølgende transkriptioner på dansk. Al lyddata er i .wav-format, mens tekstdata er i .txt-format.

I data indgår indlæsninger af Notas eget blad "Inspiration" og "Radio/TV", som er udgivet i perioden 2007 til 2022.
Nota krediteres for arbejdet med at strukturere data, således at tekst og lyd stemmer overens.

Nota er en institution under Kulturministeriet, der gør trykte tekster tilgængelige i digitale formater til personer med synshandicap og læsevanskeligheder, fx via produktion af lydbøger og oplæsning af aviser, magasiner, mv.

ReadMe

Alvenir har lagt datasættet på Hugging Face, så du også kan tilgå data via Hugging Face. Du finder adgang til datasættet på Hugging Face under distributionerne.

Data og Distribution(er)

Yderligere info

Felt Værdi
Destinationsside https://sprogteknologi.dk/dataset/notalyd-ogtekstdata
Metadata sidst opdateret november 2, 2022, 13:20 (UTC)
Metadata oprettet september 19, 2022, 08:30 (UTC)
Emne Sprog og retskrivning Uddannelse, kultur og sport
GUID 5cb5dde0-7062-4e6f-879e-9a02cbd6a977
Kontaktemail info@sprogteknologi.dk
Kontaktnavn Digitaliseringsstyrelsen
Opdateret 26-04-2022
Opdateringsfrekvens http://publications.europa.eu/resource/authority/frequency/UNKNOWN
Sprog dansk
URI https://data.gov.dk/dataset/lang/5cb5dde0-7062-4e6f-879e-9a02cbd6a977
Udgivelsesdato 07-10-2022
Dokumentation
Dataansvarlig organisation Digitaliseringsstyrelsen
usage Taleteknologi