Forbedring af eksisterende sprogressource (NST Danish ASR Database)
29. oktober 2020Ny forbedret version af NST Danish ASR Database (16 kHz) på sprogteknologi.dk.
Språkbanken ved Nasjonalbiblioteket i Norge har netop publiceret en ny reorganiseret version af deres populære NST Danish ASR Database (16 kHz) til dansk talegenkendelse og diktering.
I denne nye version er mappestrukturen mere brugervenlig og filerne har fået meningsbærende navne der er uafhængige af mappestrukturen. Der udover er metadatafilerne blevet konverteret til JSON. Se dokumentationsfilen for en fuld beskrivelse af dataene og de ændringer der er blevet foretaget.
Link til NST Danish ASR Database (16 kHz) – reorganized:
https://sprogteknologi.dk/dataset/nst-danish-asr-database-16-khz-reorganized
Denne reorganisering er et godt eksempel på forbedring af en eksisterende sprogressource, således at data lettere kan anvendes.