A&ttack

Repository som indeholder kode og modelvægtene til A&ttack algortimen. Den er udviklet af Analyse og Tal F.M.B.A. med støtte fra TryghedsFonden.

Algoritmen er designet til at finde sproglige angreb i korte tekststykker. Den er blevet brugt til at finde sproglige angreb i den offentlige debat, et arbejde som man kan læse om her. En let tilgængelig beskrivelse af hvordan algoritmen er blevet til kan findes i denne artikel

Data og Distribution(er)

A&ttack - GithubBIN
Tilgå ressourcen på GitHub i bin format.
Mere information

Yderligere info test

Felt	Værdi
Destinationsside	https://github.com/ogtal/A-ttack
Metadata sidst opdateret	april 17, 2023, 08:46 (UTC)
Metadata oprettet	juli 12, 2021, 10:21 (UTC)
Emne	Sprog og retskrivning Uddannelse, kultur og sport
Kontaktemail	info@ogtal.dk
Kontaktnavn	Ronnie Taar og Edin Lind Ikanovic
Provenance	Datastatement: "Algortimen er trænet vha. et annoteret datasæt med 67.188 tekststykker. Teksstykkerne er kommentarer og svar afgivet på opslag i en række offentlige Facebook Pages og større grupper. Datasættet er opdelt i et træningsdatasæt (70 procent), et evalueringsdatasæt (20 procent) og et testdatasæt (10 procent). Trænings- og evalueringsdatasættet blev brugt til at træne og udvælge den bedste kombination af algoritmearkitektur og hyperparametre. Til det brugte vi den højest macro average F1 score. Efter udvælgelsen af den bedste algoritme blev denne testet på testdatasættet. Den bedste model bruger en dansk electra model som sprogmodel og har et feed forward lag til selve klassificeringen. Se modeldefinitionen i filen model_def.py"
Sprog	dansk
URI	https://data.gov.dk/dataset/lang/0d5b65fd-5e43-4362-a65b-429189be7d33
type	https://data.gov.dk/concept/core/lang-resource-type/Tool
Dokumentation	https://github.com/ogtal/A-ttack
usage	Databehandling og -analyse,