Ressourcer - sprogteknologi.dk

Bilingual English-Danish parallel corpus from Danish Maritime Authority website

Contents of https://www.dma.dk were crawled, aligned on document and sentence level and converted into a parallel corpus. This dataset has been created within the framework of...

TMX

Dansk Wikisource

Maskinlæsbar version af dumps fra den danske wikipedia kilder. Se https://foundation.wikimedia.org/wiki/Terms_of_Use

XML

Scrape af Retsinformation

Dansk etsproget korpus på 3,708,693 sætninger, med indhold scrapet fra www.retsinformation.dk. Korpusset er et stillbillede af indholdet på retsinformation og er ikke blevet...

TXT

23 ressourcer fundet