NST Danish ASR Database (16 kHz) – reorganized

Denne database er udviklet af Nordisk språkteknologi AS som datagrundlag for talekendelse og diktering på dansk. I denne version er dataene strukturet på en ny måde, således at databasen lettere kommer til anvendelse. I den oprindelige version af materialet var filene organiseret i en bestemt mappestruktur hvor mappenavnene var meningsbærende. Filnavnene var imidlertid ikke meningsbærende, og der fandtes også tilfælde af filer med samme navn i forskellige mapper. Dette viste sig at være upraktisk, eftersom anvendere skulle bibeholde den oprindelige mappestruktur for at kunne benytte sig af dataene. Filene er derfor navngivet påny, således at filnavnene er unikke, meningsbærende og uafhængige af mappestrukturen. De oprindelige metadatafiler var i spl-format. Disse er konverteret til JSON-formatet. De konverterede metadatafiler er også anonymiseret, og tekstkodingen er nu UTF-8 istedet for ANSI, som det oprindelige materialet havde. Se dokumentationsfilen for en fuld beskrivelse af dataene og ændringerne som er foretaget.

Data og Distribution(er)

Yderligere info

Felt Værdi
Destinationsside https://www.nb.no/sprakbanken/ressurskatalog/oai-nb-no-sbr-55/
Forfatter Nordisk språkteknologi AS, Nasjonalbiblioteket/Språkbanken
Metadata sidst opdateret Februar 22, 2021, 10:01 (UTC)
Metadata oprettet Oktober 28, 2020, 10:07 (UTC)
Dækningsperiode slut 1999
Dækningsperiode start 1995
Emne Sprog og retskrivning Uddannelse, kultur og sport
Identifier sbr-55
Kontaktemail sprakbanken@nb.no
Kontaktnavn Språkbanken
Opdateret 2020-07-01
Udgivelsesdato 2003
Udgivernavn Nationalbibliotektet i Norge
Type Korpora
Dokumentation
hasQualityMetadata no
usage ["talegenkendelse", "diktering", "fonetik"]