DanSpeech

Open-source Python-pakke til dansk talegenkendelse (tale-til-tekst).

DanSpeech har arbejdet på at udvikle generelle talegenkendelsesmodeller siden 2018. Projektet har levet som en række studenterprojekter hos Danmarks Tekniske Universitet (DTU) og kulminerede i et fælles kandidatspeciale vejledt af Lars Kai Hansen i forårssemesteret 2019. Projektet lykkedes med at anvende dyb læring på et relativt begrænset offentligt datasæt (ca. 360 timers transskriberet tale). Resultatet har gjort det muligt at arbejde med nyere og mere fleksible måder at modellere talegenkendelse på, og i sommeren 2019 blev første etape af DanSpeech-projektet sat i vandet hos DTU med det formål at offentliggøre og videreudvikle en række af de modeller, som var udviklet i løbet af specialeperioden samt frigive kodebasen, så andre kan træne modeller på deres egne data. Det er de modeller, som nu er tilgængelige under ressourcen.

Licens: https://www.apache.org/licenses/LICENSE-2.0

Data og Distribution(er)

Yderligere info

Felt Værdi
Destinationsside https://github.com/danspeech/danspeech
Metadata sidst opdateret September 9, 2020, 07:46 (UTC)
Metadata oprettet Juni 18, 2020, 10:21 (UTC)
Emne Sprog og retskrivning Uddannelse, kultur og sport
GUID https://data.gov.dk/dataset/lang/cfbba84f-2dde-402d-8cd9-c8d7d13aec4d
Kontaktemail martin@danspeech.io ; rasmus@danspeech.io
Kontaktnavn Martin Carsten Nielsen / Rasmus Arpe Fogh Jensen
Sprog dansk
URI https://data.gov.dk/dataset/lang/cfbba84f-2dde-402d-8cd9-c8d7d13aec4d
Udgivelsesdato 2019
Udgivernavn Danspeech
Type Værktøjer og teknologi