Datasæt

DanSpeech

Open-source Python-pakke til dansk talegenkendelse (tale-til-tekst).

DanSpeech har arbejdet på at udvikle generelle talegenkendelsesmodeller siden 2018. Projektet har levet som en række studenterprojekter hos Danmarks Tekniske Universitet (DTU) og kulminerede i et fælles kandidatspeciale vejledt af Lars Kai Hansen i forårssemesteret 2019. Projektet lykkedes med at anvende dyb læring på et relativt begrænset offentligt datasæt (ca. 360 timers transskriberet tale). Resultatet har gjort det muligt at arbejde med nyere og mere fleksible måder at modellere talegenkendelse på, og i sommeren 2019 blev første etape af DanSpeech-projektet sat i vandet hos DTU med det formål at offentliggøre og videreudvikle en række af de modeller, som var udviklet i løbet af specialeperioden samt frigive kodebasen, så andre kan træne modeller på deres egne data. Det er de modeller, som nu er tilgængelige under ressourcen.

Data og ressourcer

DanSpeech - Python pakkehttp://publications.europa.eu/resource/authority/file-type/HTML
Tilgå DanSpeech python pakken på GitHub.
Udforsk
- Gå til ressource

Nøgleord

Yderligere info

URI	https://data.gov.dk/dataset/lang/cfbba84f-2dde-402d-8cd9-c8d7d13aec4d
Destinationsside	https://github.com/danspeech/danspeech
Høstes af Datavejviser
Udgivelsesdato	01-01-2019
Seneste ændringsdato
Opdateringsfrekvens
Dækningsperiode	/
Emne(r)	Uddannelse, kultur og sport
Adgangsrettigheder	offentlig
Overholder
Proveniensudsagn
Dokumentation