Danish WIT
URL: https://huggingface.co/datasets/alexandrainst/danish-wit
Datasættet er den danske del af WIT-Base datasættet, som blev udgivet af WikiMedia i 2021. WIT-Base er en modificeret udgave af WIT (Wikipedia Image Text), hvor billeder med tomme "reference beskrivelser" og billeder, hvor en persons ansigts dækker mere end 10% af billedet, fjernes. Derudover slettes upassende billeder. Danish WIT datasættet indeholder omkring 160.000 billeder, som er associeret med danske beskrivelser.
Yderligere information
Felt | Værdi |
---|---|
Data last updated | ubekendt |
Metadata last updated | 12. december 2022 |
Metadata oprettet | ubekendt |
Format | parquet |
Licens | CC-BY-SA-4.0 - Creative Commons Attribution Share-Alike 4.0 |
Metadata oprettet | for 2 år siden |
Has views | False |
Id | 1c7206a4-6794-4837-add3-dde6ff2f292e |
Package id | 7026f564-6695-428f-a88d-040642927448 |
Position | 0 |
State | active |