Danish Dynaword

Udgiver

Danish Foundation Models

The Danish Foundations models collaborate with the Danish Data Science Community, Centre for Humanities Computing Aarhus, The Alexandra Institute, and Center for AI Science and...

Læs mere

Kontaktpunkt

Kenneth Enevoldsen

kenneth.enevoldsen@cas.au.dk

Datasætansvarlig organisation

Danish Foundation Models

Nonprofitorganisation

URI: https://data.gov.dk/id/organization/8c2897f6-f320-4276-af95-12791e84c330

Skaber

Danish Foundation Models

Ikke-statslig organisation

URI: https://data.gov.dk/id/organization/20f5e447-d207-4969-ae7e-2ac3ec3b2d67

Kvalificeret kreditering

Kenneth Enevoldsen; kennethcenevoldsen@cas.au.dk
Aktørrolle: Forfatter (aktør der har forfattet ressourcen)
Aktørtype: Akademisk-videnskabelig organisation

Kristian Nørgaard Jensen; kristian.n.jensen@alexandra.dk
Aktørrolle: Medforfatter (aktør der har medforfattet ressourcen)
Aktørtype: Akademisk-videnskabelig organisation

Peter Vahlstrup; imvpbv@cas.au.dk
Aktørrolle: Medforfatter (aktør der har medforfattet ressourcen)
Aktørtype: Akademisk-videnskabelig organisation

Per Møldrup Dalum; per@cas.au.dk
Aktørrolle: Medforfatter (aktør der har medforfattet ressourcen)
Aktørtype: Akademisk-videnskabelig organisation

Desmond Elliot; de@di.ku.dk
Aktørrolle: Medforfatter (aktør der har medforfattet ressourcen)
Aktørtype: Akademisk-videnskabelig organisation

Lukas Galke; galke@imada.sdu.dk
Aktørrolle: Medforfatter (aktør der har medforfattet ressourcen)
Aktørtype: Akademisk-videnskabelig organisation

Peter Schneider-Kamp; petersk@imada.sdu.dk
Aktørrolle: Medforfatter (aktør der har medforfattet ressourcen)
Aktørtype: Akademisk-videnskabelig organisation

Kristoffer Nielbo; kln@cas.au.dk
Aktørrolle: Medforfatter (aktør der har medforfattet ressourcen)
Aktørtype: Akademisk-videnskabelig organisation

Jan Kostkan; jan.kostkan@cas.au.dk
Aktørrolle: Medforfatter (aktør der har medforfattet ressourcen)
Aktørtype: Akademisk-videnskabelig organisation

Balálzs Szabó; N/A
Aktørrolle: Medforfatter (aktør der har medforfattet ressourcen)
Aktørtype: Akademisk-videnskabelig organisation

Márton Kardos; N/A
Aktørrolle: Medforfatter (aktør der har medforfattet ressourcen)
Aktørtype: Akademisk-videnskabelig organisation

Kirsten Vad; kiva@cas.au.dk
Aktørrolle: Medforfatter (aktør der har medforfattet ressourcen)
Aktørtype: Akademisk-videnskabelig organisation

Johan Heinsen; heinsen@dps.aau.dk
Aktørrolle: Medforfatter (aktør der har medforfattet ressourcen)
Aktørtype: Akademisk-videnskabelig organisation

Andrea Blasi Nuñez; abln@mmmi.sdu.dk
Aktørrolle: Medforfatter (aktør der har medforfattet ressourcen)
Aktørtype: Akademisk-videnskabelig organisation

Gianluca Barmina; gbarmina@imada.sdu.dk
Aktørrolle: Medforfatter (aktør der har medforfattet ressourcen)
Aktørtype: Akademisk-videnskabelig organisation

jacob Nielsen; jani@mmmi.sdu.dk
Aktørrolle: Medforfatter (aktør der har medforfattet ressourcen)
Aktørtype: Akademisk-videnskabelig organisation

Rasmus Larsen; rasmus.larsen@alexandra.dk
Aktørrolle: Medforfatter (aktør der har medforfattet ressourcen)
Aktørtype: Akademisk-videnskabelig organisation

Licenser

Other (Attribution)

Datasæt

Danish Dynaword

The Danish dynaword is a collection of Danish free-form text datasets from various domains. All of the datasets in Danish Dynaword are openly licensed and deemed permissible for training large language models.

Danish Dynaword is continually developed, which means that the dataset will actively be updated as new datasets become available. The authors welcome contributions to the dataset, including new sources, improved data filtering, and other enhancements. Please consult the contribution guidelines beforehand.

Please note that the license varies from dataset to dataset in the ressource and we advice users to inform themselves about the license on the specific datasets they intend to use.

Data og ressourcer

Danish Dynaword - Datahttp://publications.europa.eu/resource/authority/file-type/PARQUET
Tilgå ressourcen her
Udforsk
- Gå til ressource

Nøgleord

Yderligere info

URI	https://data.gov.dk/dataset/lang/956719a6-e440-4d1c-908e-1144ee6e277e
Destinationsside	https://huggingface.co/datasets/danish-foundation-models/danish-dynaword
Høstes af Datavejviser	Nej
Udgivelsesdato	04-08-2025
Seneste ændringsdato	05-08-2025
Opdateringsfrekvens	kontinuerlig
Dækningsperiode	/
Emne(r)	Regeringen og den offentlige sektor Uddannelse, kultur og sport
Adgangsrettigheder	offentlig
Overholder
Proveniensudsagn
Dokumentation	https://huggingface.co/datasets/danish-foundation-models/danish-dynaword/blob/main/README.md