4 ressourcer fundet

Organisationer: Center for Sprogteknologi Tags: Tekst

Filtrér resultater
  • The Danish similarity dataset is a gold standard resource for evaluation of Danish word embedding models. The dataset consists of 99 word pairs rated by 38 human judges...
  • CST's modificerede udgave af BRILL-taggeren POS-tagger i C/C++
  • CST's tokeniserings- og segmenteringsprogram til tekst- og RTF-filer. Opdeler en tekst i ord og ordforbindelser
  • CST's lemmatiser fører hvert ord i en tekst tilbage til grundformen, lemmaet.