Skip to main content

FT-Speech

FT Speech er et dansk korpus med folketingets taler i lydformat og manuelt transskriberet tekst. Datasættet er blevet kureret af Andreas Kirkedal, Marija Stepanović og Barbara Plank som en del af deres videnskabelige artikel med samme navn, og derefter reorganiseret og uploadet af Dan Saattrup Nielsen fra Alexandra Instituttet.

Der er knap en million samples med 374 unikke talere i træningssættet og yderligere talere i validerings- og testsæt.

Datasættet er underlagt samme brugerdefinerede licens, som alt andet af Folketingets materiale.

Data og ressourcer

Nøgleord

Yderligere info

URI https://data.gov.dk/dataset/lang/1c4cd390-bddf-48fc-b5af-981b65b4e8b3
Destinationsside https://ftspeech.github.io/
Høstes af Datavejviser Nej
Udgivelsesdato 14-09-2020
Seneste ændringsdato
Opdateringsfrekvens aldrig
Dækningsperiode  / 
Emne(r)
  • 16.05.07 Sprog og retskrivning
  • Regeringen og den offentlige sektor
Adgangsrettigheder offentlig
Overholder
Proveniensudsagn
Dokumentation