DK-CLARIN Referencekorpus med dansk almensprog

DK-CLARIN Reference Corpus of General Danish has been collected as part of DK-CLARIN project, WP2.1, 2008 - 2011. All texts are in XML TEIP5 format (TEIP5DKCLARIN-format), with tokenisation, ePOS-tagging, sentence and paragraph segmentation, and lemmatisation. The corpus comprises 45,113,245 words.

Yderligere info

Felt Værdi
Metadata sidst opdateret September 9, 2020, 08:29 (UTC)
Metadata oprettet Juni 16, 2020, 07:38 (UTC)
Emne Sprog og retskrivning Uddannelse, kultur og sport
GUID http://hdl.handle.net/20.500.12115/36
Identifier http://hdl.handle.net/20.500.12115/36
Kontaktemail korpus@dsl.dk
Kontaktnavn DSL
URI http://hdl.handle.net/20.500.12115/36
Udgivelsesdato 2011
Udgivernavn DSL
Type Korpora
Dokumentation