Skip to main content

Kommunal semantisk grundmodel 1

Kommunal Semantisk Grundmodel nr. 1 er en videretræning af det Norske nationalbiblioteks AI laboratories (NbAiLab) BERT-Base sprogmodel, og er trænet på 2,672,566 unikke sætninger som er skrabet og filtreret fra 94 kommunale hjemmesider.

Sprogmodellen er af typen Masked Language Model (MLM), på dansk en maskeret sprogmodel. Sprogmodellen er trænet til at prædiktere ord-kandidater til ét eller flere maskerede ord i en given sekvens af ord. Ved en succesfuld træning med denne metode opnår sprogmodellen såvel sprog som semantisk forståelse, og kan derfor anvendes til f.eks. semantisk søgning ved at producere embeddings (matematiske repræsentationer af ordsekvenser; f.eks. en sætning). Embeddings kan anvendes til at fremsøge synonymer til bestemte ord i en sekvens eller til at vurdere den sproglige sammenhæng af en given sætning.

Modellen kan finjusteres på nye data og den kan videretrænes til at løse bestemte opgavetyper som f.eks. identifikation af navngivne entiteter, tekstanalyse i mange former, sentiment klassifikation, chatbot funktionalitet, sentiment-scoring m.v.

Modellen er udarbejdet i forbindelse med AI-aktindsigt, som er et samarbejde mellem Sønderborg Kommune, Vejen Kommune, Fredensborg Kommune og virksomheden Aktio.

Du finder BERT-base modellen her

Data og ressourcer

Nøgleord

Yderligere info

URI https://data.gov.dk/dataset/lang/b4818951-7648-4883-bdef-81a85bc3a661
Destinationsside https://huggingface.co/AI-aktindsigt/kommunal_semantisk_grundmodel_1_og_2
Høstes af Datavejviser
Udgivelsesdato 13-03-2024
Seneste ændringsdato 19-12-2023
Opdateringsfrekvens aldrig
Dækningsperiode  / 
Emne(r)
  • 05.05 Offentlig forvaltning og demokrati
  • Regeringen og den offentlige sektor
Adgangsrettigheder offentlig
Overholder
Proveniensudsagn
Dokumentation