CopCo: Nyt eye-tracking korpus undersøger læseadfærd af danske tekster
21. december 2022Eye-tracking data er et vigtigt værktøj for natural language processing, og du kan nu tilgå et eye-tracking korpus på sprogteknologi.dk, som undersøger læseadfærd af danske tekster.
Læseadfærd af danske tekster er hovedfokus i det nye eye-tracking korpus Cop-Co: The Copenhagen Corpus of Eye-Tracking Recording from Natural Reading, som er udarbejdet af Nora Hollenstein, Marina Björnsdóttir og Maria Barrett i samarbejde med Københavns Universitet.
Gå til korpusset på sprogteknologi.dk.
Korpusset er blevet udstillet på sprogteknologi.dk, og det er skræddersyet til både psykolingvistik og natural language processing. CopCo inkluderer tekster, som er uddraget af en samling manuskripter fra Danske Taler.
Målet med korpusset er at undersøge læseadfærd af danske tekster hos forskellige befolkningsgrupper. Det indeholder derfor data på øjenbevægelser hos deltagere med dansk som modersmål, både folk med og uden dysleksi. Derudover er der et sæt med data fra folk, som har dansk som andetsprog.
Eye-tracking data er et vigtigt værktøj for kognitivt inspireret natural language processing, da det kan bruges til at evaluere og forbedre anvendelse af dansk sprogteknologi. Lige nu arbejder Nora Hollenstein, Marina Björnsdóttir og Maria Barrett på sprogteknologiske løsninger baseret på machine learning til sporing af dysleksi og forudsigelse af modersmål.
Vi håber, at udgivelsen af CopCo-korpusset kan være med til at understøtte udviklingen af natural langugage processing og dansk sprogteknologi.