ScandiQA
URL: https://huggingface.co/datasets/alexandrainst/scandiqa
ScandiQA er et datasæt bestående af spørgsmål og svar på dansk, norsk og svensk. Alle samples kommer fra Natural Questions (NQ) datasættet, som er et stort datasæt med spørgsmål og svar fra Googlesøgninger. Det skandinaviske datasæt med spørgsmål og svar kommer fra MKQA-datasættet, hvor 10.000 NQ-samples er blevet manuelt oversat til blandt andet dansk, norsk og svensk.