Danish DSL and Reddit word2vec word embeddings

Sprogmodel trænet på DSL’s interne korpus, 1 milliard tokens. Med en Word2vec-mokan man automatisk finde ord der ligner hinanden semantisk

OBS: Licensbetingelserne for anvendelse af denne ressource er under revision. Ny information herom vil blive præsenteret på korpus.dsl.dk.

Data og Distribution(er)

Yderligere info

Felt Værdi
Destinationsside https://figshare.com/articles/Danish_DSL_and_Reddit_word2vec_word_embeddings/8099927
Metadata sidst opdateret September 9, 2020, 07:46 (UTC)
Metadata oprettet Juni 16, 2020, 07:38 (UTC)
Emne Uddannelse, kultur og sport Sprog og retskrivning
GUID https://data.gov.dk/dataset/lang/b21f8377-82c6-47a8-8d70-93fd4862f613
Kontaktemail korpus@dsl.dk
Kontaktnavn DSL
Opdateret 2019
URI https://data.gov.dk/dataset/lang/b21f8377-82c6-47a8-8d70-93fd4862f613
Udgivelsesdato 2019
Udgivernavn DSL
Type Værktøjer og teknologi