Et Centralt Ordregister for Dansk

26. januar 2023

Dekorativt indhold.Udviklingen af Centralt Ordregister for dansk (COR) er et samarbejdsprojekt mellem Det Danske Sprog- og Litteraturselskab, Dansk Sprognævn, Center for Sprogteknologi på KU og Digitaliseringsstyrelsen om at udvikle en dansk sprogressource til AI-formål.

Målsætningen med COR er at gøre alle basisoplysninger om danske ord tilgængelige på en standardiseret og international kompatibel måde og dermed sikre, at der kan skabes bedre og nemmere sammenhæng i de sprogteknologiske løsninger, der udvikles fremadrettet.

Det Centrale Ordregister understøtter dansk sprogteknologi ved at:

-    forlænge levetiden af danske korpusser
-    støtte effektiv deling af danske sprogressourcer
-    give åben adgang til betydningsinformationer om danske ord
-    forøge sprogforståelsen i dansk sprogteknologi og dermed kvaliteten af dansksproget kunstig intelligens

Nu er den endelige version af COR Indekset i luften og kan findes på http://ordregister.dk. Her kan du også følge med i de opdateringer der vil være af registeret.

Siden lanceringen blandt dele af det sprogteknologiske miljø tilbage i maj måned er der justeret og lagt sidste hånd på indekseringen. Desuden kan du samme sted finde tekniske specifikationer og vejledninger.

COR er et maskinlæsbart register, der dækker hele det centrale danske ordforråd. COR indeholder udvalgte lemmaer, som har en officiel staveform. Hver ordform har et unikt id-nummer, som vil blive fastholdt i fremtiden. Hvis den officielle stavenorm ændres, bliver ændringerne gjort centralt tilgængelige således, at sprogteknologiske produkter automatisk kan holdes ajour. COR kan gennem tiden udvides med flere beskrivelser af hvert lemma gennem tilknytning af andre ordbøger inden for forskellige nicher.

Fremadrettet vil der komme flere tilføjelser til COR, som vil give anvenderne nye data omkring danske ord. Du kan holde dig opdateret på vores COR-side, hvor vi løbende vil linke til de forskellige produkter, der udvikles i forbindelse med COR projektet.