Generelle betingelser
Udgiver af sprogressourcer
Målet med sprogteknologi.dk er at give interesserede en let og samlet adgang til metadata om danske sprogressourcer for at understøtte udviklingen af sprogteknologi og kunstig intelligens på dansk og dermed bidrage til at sikre, at det digitale sprog i Danmark er dansk. Samtidig giver det udgiverne mulighed for at udstille deres sprogressourcer, få deres navn og logo på sprogteknologi.dk samt automatisk at blive høstet til udstilling samt af en dansk fællesoffentlig dataportal og Den Europæiske Dataportal.
Vi opfordrer alle udgivere til at:
- bekræfte de metadata, sprogteknologi.dk har om dine sprogressourcer
- bekræfte eller informere sekretariatet, såfremt der sker ændringer i metadata om de sprogressourcer, som du udgiver
- bekræfte, at der kun udstilles metadata om de af dine sprogressourcer, der ikke er betalingspålagte
- bekræfte eller angive under hvilken licens, dine sprogressourcer må benyttes
Hvilken type adgangsrettighed har brugere til data og ressourcer?
På sprogteknologi.dk udstilles metadata om ressourcer og datasæt der enten er offentlige eller delvist offentlige rettet mod en begrænset kreds, fx til forskningsbrug eller en specifik anvendelse under særlige vilkår. Portalen udstiller ikke metadata om sprogressourcer, der er betalingspålagt.
Licenser
Det er udgivers eget ansvar at definere under hvilke betingelser, data må anvendes. Udgiver bør derfor angive, hvilken licens sprogressourcen udstilles med ved reference til et licensdokument. Dog er det en klar anbefaling, at sprogressourcerne udstilles med en så åben licens som muligt (se fx Creative Commons).
Etisk anvendelse af sprogressourcer
Udviklingen af sprogteknologiske løsninger rummer store muligheder for innovation. Men, som ved al brug af data, følger også en række etiske overvejelser omkring eksempelvis bias i data og muligheder for misbrug af data.
Både dataudstillere og dataanvendere opfordres til aktivt at forsøge at undgå bias ved at sikre, at alle køn, aldersgrupper, befolkningsgrupper med videre er repræsenteret, og ved tydeligt at notere det, hvor bias ikke kan undgås.
Brugere af sprogteknologi.dk forventes til en hver tid at anvende data på en etisk forsvarlig måde, som på ingen måde kan formodes at vildlede eller volde skade. Desuden skal det altid være tydeligt, når brugere interagerer med en maskine og ikke et levende menneske.
Find mere information om principper og dataetiske værktøjer hos Dataetisk Råd.
FAIR-principperne
Metadata på sprogteknologi.dk skal stræbe efter at leve op til FAIR-principperne. Ved at have sine data registreret på sprogteknologi.dk øger man findbarheden, og metadata på sprogteknologi.dk er udførlige og læsbare for både mennesker og maskiner.
FAIR-principperne indebærer at gøre data brugbart ved sikre, at data er:
- Findable (findbare)
- Accessible (tilgængelige)
- Interoperable (systemuafhængige)
- Reusable (anvendelige – så både mennesker og computere kan læse dem)
Læs mere hos 'The Go FAIR Initiative'.
Metadata
Metadata tilføjes eller høstes til sprogteknologi.dk af Digitaliseringsstyrelsen. Oplysningerne er baseret på metadatabeskrivelser af datasæt eller andre sprogressourcer, som er tilvejebragt af forskellige udgivere.
Metadatabeskrivelserne af sprogressourcer, som sprogteknologi.dk udstiller, stilles frit til rådighed for alle anvendere og kan genbruges og videredistribueres under CC0 1.0 - https://creativecommons.org/publicdomain/zero/1.0/.
Høstes metadata til portalen opfordres der til, at udgiver gør opmærksom på opdateringer i metadata om den pågældende ressource. Ønsker udgiver i stedet en fast opdateringscyklus kan dette eventuelt aftales særskilt med sprogteknologi.dk.
Ejerskabet til og ansvaret for datasæt eller øvrige sprogressourcer forbliver hos den enkelte organisation, der har udgivet pågældende sprogressourcer. Organisationen har fortsat ansvaret for validiteten og kvaliteten af den enkelte sprogressource og det fulde juridiske ansvar for de sprogressourcer, som de udgiver.