ScandiNER

ScandiNER er en NER (named entity recognition) model, som er bygget på den norske model fra det norske nationalbiblioteks AI labbet. Modellen er fin tunet på et kombineret dansk, norsk (bokmål og nynorsk), svensk, islandsk og færøsk NER datasæt.

SacndiNER opnår state-of-the-art performance i alle 5 sprog, fylder 3x mindre end tidligere danske state-of-the-art modeller (DaCy-large) og er 5x hurtigere.

Licens: udgivet under en MIT-licens.

Data og Distribution(er)

Yderligere info

Felt Værdi
Destinationsside https://huggingface.co/saattrupdan/nbailab-base-ner-scandi
Metadata sidst opdateret oktober 15, 2021, 08:25 (UTC)
Metadata oprettet oktober 11, 2021, 07:39 (UTC)
Emne Sprog og retskrivning Uddannelse, kultur og sport
Kontaktemail saattrupdan@gmail.com
Kontaktnavn Dan Saattrup Nielsen
Sprog Dansk Bokmål Nynorsk Svensk Islandsk Færøsk
URI https://data.gov.dk/dataset/lang/d157317c-ffa8-4e5e-8c72-d2aaaf1c0f3e
Udgivelsesdato 28-09-2021
Udgivernavn Dan Saattrup Nielsen
Dokumentation