-
A billion-word corpus of Danish text. Split into many sections, and covering many dimensions of variation (spoken/written, formal/informal, modern/old, rigsdansk/dialect, and so...
- TXT
-
Et bibliotek med over 60.000 Gutenberg e-bøger. Læs mere om licenser og copyright her: https://www.gutenberg.org/wiki/Category:How-To
- HTML
-
Dansk etsproget korpus på 3,708,693 sætninger, med indhold scrapet fra www.retsinformation.dk. Korpusset er et stillbillede af indholdet på retsinformation og er ikke blevet...
- TXT
-
MULINCO - MUltiLINgual Corpus of the University of COpenhagen. 7 eventyr af H.C.Andersen, tekster af Edgar Allen Poe, Saxos Danmarks historie og EU-traktater på flere sprog...
-
Denne databasen er laget av Nordisk språkteknologi som datagrunnlag for talegjenkjenning og diktering på dansk. I denne versjonen er dataene strukturert på nytt, slik at...
- TAR
-
Denne database er udviklet af Nordisk språkteknologi AS som datagrundlag for talekendelse og diktering på dansk. I denne version er dataene strukturet på en ny måde, således at...
- TAR
-
Language processing resources and tools for Bornholmsk, a language spoken on the island of Bornholm, with roots in Danish and closely related to Scanian. Includes corpora, word...
- ZIP
-
Ordliste og værktøj til sentimentanalyse skrevet i Python.
- TXT
-
List of a limited number of Danish compound words. Each line lists a word with one or more vertical bar as the separator between the individual parts of the compound word.
- TXT
-
Dansk oversættelse af WordSim-353-word similarity datasættet som vedligeholdes af Evgeniy Gabrilovich.
- CSV
-
Komma opdelt fil med fire ord på hver linje, hvor det fjerde ord er en semantisk outlier.
- CSV
-
J.C.S. Espersen: Bornholmsk Ordbog, 1908, Inclusive Lydlære af Vilh. Thomsen og bøjningslære af Ludv. F.A. Wimmer. BCP-47: da-DK-bornholm.