-
The Danish similarity dataset is a gold standard resource for evaluation of Danish word embedding models. The dataset consists of 99 word pairs rated by 38 human judges...
-
CST's modificerede udgave af BRILL-taggeren POS-tagger i C/C++
-
CST's tokeniserings- og segmenteringsprogram til tekst- og RTF-filer. Opdeler en tekst i ord og ordforbindelser
-
CST's lemmatiser fører hvert ord i en tekst tilbage til grundformen, lemmaet.