Open-source Python-pakke til dansk talegenkendelse (tale-til-tekst).
DanSpeech har arbejdet på at udvikle generelle talegenkendelsesmodeller siden 2018. Projektet har levet som en række studenterprojekter hos Danmarks Tekniske Universitet (DTU) og kulminerede i et fælles kandidatspeciale vejledt af Lars Kai Hansen i forårssemesteret 2019. Projektet lykkedes med at anvende dyb læring på et relativt begrænset offentligt datasæt (ca. 360 timers transskriberet tale). Resultatet har gjort det muligt at arbejde med nyere og mere fleksible måder at modellere talegenkendelse på, og i sommeren 2019 blev første etape af DanSpeech-projektet sat i vandet hos DTU med det formål at offentliggøre og videreudvikle en række af de modeller, som var udviklet i løbet af specialeperioden samt frigive kodebasen, så andre kan træne modeller på deres egne data. Det er de modeller, som nu er tilgængelige under ressourcen.
Licens: https://www.apache.org/licenses/LICENSE-2.0