A&ttack

Repository som indeholder kode og modelvægtene til A&ttack algortimen. Den er udviklet af Analyse og Tal F.M.B.A. med støtte fra TryghedsFonden.

Algoritmen er designet til at finde sproglige angreb i korte tekststykker. Den er blevet brugt til at finde sproglige angreb i den offentlige debat, et arbejde som man kan læse om her. En let tilgængelig beskrivelse af hvordan algoritmen er blevet til kan findes i denne artikel

Data og Distribution(er)

Yderligere info test

Felt Værdi
Destinationsside https://github.com/ogtal/A-ttack
Metadata sidst opdateret april 17, 2023, 08:46 (UTC)
Metadata oprettet juli 12, 2021, 10:21 (UTC)
Emne Sprog og retskrivning Uddannelse, kultur og sport
Kontaktemail info@ogtal.dk
Kontaktnavn Ronnie Taar og Edin Lind Ikanovic
Provenance Datastatement: "Algortimen er trænet vha. et annoteret datasæt med 67.188 tekststykker. Teksstykkerne er kommentarer og svar afgivet på opslag i en række offentlige Facebook Pages og større grupper. Datasættet er opdelt i et træningsdatasæt (70 procent), et evalueringsdatasæt (20 procent) og et testdatasæt (10 procent). Trænings- og evalueringsdatasættet blev brugt til at træne og udvælge den bedste kombination af algoritmearkitektur og hyperparametre. Til det brugte vi den højest macro average F1 score. Efter udvælgelsen af den bedste algoritme blev denne testet på testdatasættet. Den bedste model bruger en dansk electra model som sprogmodel og har et feed forward lag til selve klassificeringen. Se modeldefinitionen i filen model_def.py"
Sprog dansk
URI https://data.gov.dk/dataset/lang/0d5b65fd-5e43-4362-a65b-429189be7d33
type https://data.gov.dk/concept/core/lang-resource-type/Tool
Dokumentation
usage Databehandling og -analyse,