Sprogteknologisk konference 2023 afholdt

14. november 2023

Dekorativt indhold.

Sprogteknologisk konference 2023 udgjorde for tredje år i træk samlingspunkt for aktører og personer med interesse for dansk sprogteknologi. Alt fra offentlige myndigheder private virksomheder, studerende og forskere, var samlet til et heldagsarrangement dedikeret til dansk sprogteknologi. Herunder får du et tilbageblik på dagen og du kan tilmed finde slides og præsentationer fra dagen.

Flere end 130 sprogteknologi-interesserede var samlet til konferencen, som fandt sted på Søndre Campus og blev afholdt af Digitaliseringsstyrelsen og Center for Sprogteknologi ved Københavns Universitet. Dagen bød på en række spændende emner inden for dansk kunstig intelligens og sprogteknologi fra forskere, virksomheder og offentlige myndigheder.

Dagen lagde ud med en velkomst fra dekanen for det Humanistiske Fakultet, Kirsten Busch Nielsen og en varm hilsen fra daværende Digitaliserings- og ligestillingsminister Marie Bjerre, hvorefter Bolette Sandford Pedersen, centerleder ved Center for Sprogteknologi og Jane Sofia Gyberg Rasmussen, kontorchef i Digitaliseringsstyrelsen bød velkommen med en introduktion til dagen.

Amaru Cuba Gyllensten fra AI Sweden lagde ud med at tale om GPT-SW3 sprogmodellen og hvordan modellen er blevet bygget. Han delte desuden også indsigter i hvordan datagrundlaget så ud og løftede sløret for, hvad næste skridt i processen for den svenske sprogmodel. Spørgsmålene var mange og interessen var stor, da det næste oplæg fra Milena Anguelova Krogsgaard fra Poul Schmith gjorde os klogere på den nært forestående AI-forordning, problemer ved data og ophavsret, samt dataetik og ansvarlighed. Derfra fik Henri Schulte fra Microsoft scenen, hvor han, med liveundertekster, kunne tage os igennem den hektiske udvikling generativ AI har været igennem, samt nævne data, sprog og funktioner som de tre grundstøtter, som er nødvendige for at bygge generativ AI applikationer med gennemslagskraft.

Konferencen havde også to oplæg om sprogteknologi i praksis, hvor det første blev præsenteret af cheflæge i Øre-Næse- Halskirurgi og Audiologi og Simon Sørensen fra 2021.ai. Afdelingen på Rigshospitalet og AI-virksomheden har i samarbejde lavet en sprogmodel, hvis formål er at besvare spørgsmål fra skjold-bruskkirtelkræft patienter, som de kunne have i forbindelse med deres kræft-forløb. Et interessant samarbejde, hvor der nu blev kigget mod oplæring, implementering og skalering. Det andet oplæg var fra Liv Moeslund, som præsenterede den kommunale chatbot MUNI, som er i funktion i over 30 kommuner. Der kom et kig under kølerhjelmen på modellen, som lige nu indeholder over 7000 prædefinerede svar på en bred vifte af borgerhenvendelser.

Kenneth Enevoldsen og Lasse Hansen talte om Danish Foundation Models projektet, som bestræber sig på udvikle og vedligeholde veldokumenterede højkvalitets fundamentsmodeller til dansk. Desuden fortalte de også lidt om arbejdet med Danish Colossal Corpus (DCC), som er et stort dansk tekstkorpus, som deres modeller skal trænes på.

De to sidste oplæg på dagen kom fra 2 forskere. Anna Rogers fra IT-Universitet i København tænkte højt på scenen og satte spørgsmålstegn ved teorierne om, hvorvidt sprogmodeller kan lige selv at spille skak eller tale fransk eller om denne tilsyneladende tillærte viden i virkeligheden er et levn fra træningsdata. Dagens sidste oplæg fra Desmond Elliot fra Datalogisk Institut ved Københavns Universitet forsøgte at ændre premissen for hvordan vi benytter tekst til at træne generative modeller. Han fremlagde idéen om at kigge på tekst som pixels fremfor tokens.

Ud over de mange spændende oplæg, var der i konferencens pauser indlagt postersessioner. Her blev der præsenteret igangværende sprogteknologiske projekter, hvor konferencens gæster kunne gå rundt mellem standene og høre om projekterne. Her kunne man eksempelvis høre mere om ”Udvikling af danske bench markdata for sprogforståelse”, ”SkoleGPT”, ”EU Language Data Space og EU Alliancen for sprogteknologi” og meget, meget andet.

For os på sprogteknologi.dk var det særligt positivt at se de mange fremmødte og mærke interessen for udviklingen af dansksproget sprogteknologi. Der skal lyde et stort tak fra Digitaliseringsstyrelsen og Center for Sprogteknologi ved Københavns Universitet til de mange deltagere til konferencen!

Se eller gense PowerPoints fra konferencen:

GPT-SW3 - Next iterations

Rettigheder og ophavsret

Forget about the model: How to build AI applications with impact

Muni: Chabot hjælper 37 kommuner med spørgsmål fra borgere

Danish Foundational Models

Supporting thybroid cancer patients with AI

Language Modelling from Pixels

A Sanity Check on Emergent Properties

Se eller gense posterpitch præsentationer

Poster-pitch præsentationer