Begrebsliste
Bemærk at denne begrebliste er under udarbejdelse, og at den efter færdiggørelse vil blive forelagt et forum relevant for emneområdet til godkendelse.
Metadata for "Begrebsliste: Begreber relevante ifm. sprogteknologi.dk"
Begrebsliste: Begreber relevante ifm. sprogteknologi.dk
- Namespace: https.//data.gov.dk/concept/profile/sprogteknologi-dk (foreslået)
- Modelnavn (label): Begreber relevante ifm. sprogteknologi.dk
- Modelansvarlig (responsibleEnity): Digitaliseringsstyrelsen
- Versionsnummer (versionInfo): 0.2.0
- Seneste opdateringsdato (dateModified) 2020-06-16
- Modelomfang (modelScope): application
- Modelstatus (modelStatus): development
- Godkendelsesstatus (approvalStatus): afventer godkendelse (af et forum relevant for emneområdet)
- Forretningsområde (theme): https://form-online.dk/opgavenoegle/16/#16.05.07
- Kommentar (comment): Begrebsmodel der indholder centrale begreber i forhold til portalen sprogteknologi.dk, som har personer med interesse for og nogen kendskab til sprogteknologi, men som ikke er fageksperter, som målgruppe
NB: Begrebslisten er oprettet i henhold til FDAs "Vejledning til modellering". En del af modelleringsmetoden går ud på at genbruge eksisterende begreber og angive referencer til kilder, hvor definitionen er hentet eller udledt fra. Modelreglerne anviser også, hvorledes definitioner stuktureres i overensstemmelse med gældende standarder og best practices på området, herunder ISO 704, ISO 1087 og Terminologi 1 - principper og metoder af Bodil Nistrup Madsen.
akustisk model
statisk model over hyppigheder af sproglyde og deres sammensætninger på et givet sprog
En akustisk model bruges i taleteknologi til at repræsentere forholdet mellem lydsignaler og fonemer eller andre sproglige enheder der udgør tale.
https://sproget.dk/temaer/sprogteknologi/talesyntese-og-talegenkendelse
Ja
acoustic model
algoritme
endelig liste af veldefinerede instruktioner for hvordan en given opgave skal løses
Et computerprogram udgøres fx af forbundne algoritme beskrevet i programmeringssprog.
http://www.informationsordbogen.dk/concept.php?cid=2832
Nej
algorithm
annotation
opmærkning; annotering
at forsyne ord og andre sprogelementer med metadata
Fx oplysninger om ordklasse eller udtale.
https://dsn.dk/udgivelser/sprognaevnets-udgivelser/sprognaevnets-rapporter/sprogteknologi-i-verdensklasse
Ja
annotation
annoterede sprogdata
sprogdata der er forsynet med metadata på tekstniveau samt på ordniveau
Fx grammatisk opmærkning på ordniveau.
https://dsn.dk/udgivelser/sprognaevnets-udgivelser/sprognaevnets-rapporter/sprogteknologi-i-verdensklasse
Ja
annotated language data
begrebsmodel
model der beskriver begreber inden for et bestemt emneområde eller anvendelseskontekst og disse begrebers indbyrdes relationer
https://arkitektur.digst.dk/metoder/regler-begrebs-og-datamodellering
Nej
concept model
blark
grundlæggende sprogressourcesamling
samling af grundlæggende sprogressourcer der er nødvendige for at udvikle sprogteknologi for et givet sprog
http://www.blark.org/
Ja
basic language resource kit
data statement
metadata om et datasæts oprindelse der har til formål at synliggøre bias i datasættet
Der er bl.a. tale om demografiske oplysninger om bidragsydere og dataindsamlere og om hvordan datasættet er indsamlet
https://www.aclweb.org/anthology/Q18-1041.pdf
Ja
data statement
datasæt
datasamling
samling af data, udgivet eller arrangeret af en enkelt kilde og som er til rådighed for adgang til eller download af i en eller flere repræsentationer
Kurateret dækker her over udvælgelse og organisering.
http://www.w3.org/ns/dcat#Dataset
Nej
dataset
digital assistent
virtuel personlig assistent
it-løsning som kan assistere og interagere med mennesker på en menneskelig måde
Fx chatbot
https://www.techopedia.com/definition/31383/intelligent-virtual-assistant
Ja
digital assistant
dyb læring
superviseret læring
maskinlæring som opnås gennem træning på annoterede data
https://dsn.dk/udgivelser/sprognaevnets-udgivelser/sprognaevnets-rapporter/sprogteknologi-i-verdensklasse
Nej
deep learning
emneklassifikation
opdeling af en given genstandsmængde i klasser ud fra deres emnemæssige tilhørsforhold.
Emnebaseret kategorisering af ressourcer, fx klassificering af borger/kundehenvendelser ift. hvilken afdeling der skal håndtere dem, inddelling af ressourcer ift. videnskabelig disciplin eller opmærkning af sager med typeinformation.
https://denstoredanske.lex.dk/klassifikation_-_ordning_i_klasser
Ja
subject classification
fonem
sproglyd med betydningsadskillende funktion
Alfabetet bygger i princippet på fonemer, således at hvert bogstav i princippet skulle repræsentere et fonem. Der er dog mange afvigelser fra det princip, fx udtrykkes a med forskellige fonemer i har og hat.
https://denstoredanske.lex.dk/fonem
Ja
phoneme
fonetik
læren om sprogets lydlige side
https://denstoredanske.lex.dk/fonetik
Ja
phonetics
glosar
ordbog der indeholder betegnelser fra et eller flere domæner eller emneområder sammen med oversættelser til et eller flere sprog
https://www.iso.org/obp/ui/#iso:std:iso:1087:ed-2:v1:en:term:3.7.6
Ja
glossary
korpus
samling af tekst eller tale
The META-SHARE Metadata Schema
Ja
corpus
kunstig intelligens
ai
algoritmer der ved at analysere og finde mønstre i data kan identificere den mest hensigtsmæssige løsning
https://www.regeringen.dk/media/6537/ai-strategi_web.pdf
Nej
artificial intelligence
leksikalsk ressource
sprogressource som repræsenterer leksikalsk eller begrebsmæssig viden
Fx ordbøger eller termdatabaser.
The META-SHARE Metadata Schema
Ja
lexical resource
maskinlæring
proces der bruger algortimer der muliggør læring fra eksisterende data for at forudsige fremtidige resultater
https://www.iso.org/obp/ui/#iso:std:iso-iec:38505:-1:ed-1:v1:en:term:3.7
Nej
machine learning
maskinoversættelse
oversættelse fra et sprog til et andet foretaget af en computer
http://denstoredanske.dk/Sprog,_religion_og_filosofi/Sprog/Datalingvistik_og_sprogteknologi/Maskinovers%C3%A6ttelse
Ja
machine translation
monolingval
vedrører, er skrevet på eller foregår på ét sprog
https://ordnet.dk/ddo/ordbog?query=monolingval
Ja
monolingual
natursprog
naturligt sprog
naturligt opstået sprog der anvendes af mennesker til at kommunikere med hinanden
Modsat kunstige sprog, som fx esperanto eller programmeringssprog.
https://www.collinsdictionary.com/us/dictionary/english/natural-language
Ja
natural language
natursprogsbehandling
nlp
naturligt opstået sprog der anvendes af mennesker til at kommunikere med hinanden
https://towardsdatascience.com/natural-language-processing-nlp-for-machine-learning-d44498845d5b
Ja
natural language processing
navnegenkendelse
ner
identifikation af navne i løbende tekst
Kan inkluderer klassifkation af typen af navn, fx person-, sted- eller organisationsnavn.
https://towardsdatascience.com/named-entity-recognition-with-nltk-and-spacy-8c4a7d88e7da
Ja
named entity recognition
nøgleordsanalyse
keywordanalyse
identifikation af de væsentligste indholdsord i en tekst ved statistisk analyse
https://www.moos-bjerre.dk/ydelser/noegleordsanalyse/
Ja
keyword detection
ontologi
formel beskrivelse af de begreber og sammenhænge inden for et bestent område
https://denstoredanske.lex.dk/vidensrepr%C3%A6sentation
Ja
ontology
ordbog
leksikalsk opslagsværk der indeholder oplysninger om ord og deres sproglige form og indhold, fx stavning, ordklasse, bøjning, udtale, betydning, brug, synonymer og historie i et sprog eller om ordenes oversættelse til et andet sprog
https://ordnet.dk/ddo/ordbog?query=ordbog
Ja
dictionary
overfladeorienteret læring
ikke-superviseret læring
maskinlæring som opnås gennem træning på rådata
Står i modsætning til dyb læring (supervised learning).
https://dsn.dk/udgivelser/sprognaevnets-udgivelser/sprognaevnets-rapporter/sprogteknologi-i-verdensklasse
Nej
unsupervised learning
overfladeorienteret læring
ikke-superviseret læring
maskinlæring som opnås gennem træning på rådata
Står i modsætning til dyb læring (supervised learning).
https://dsn.dk/udgivelser/sprognaevnets-udgivelser/sprognaevnets-rapporter/sprogteknologi-i-verdensklasse
Nej
unsupervised learning
oversættelseshukommelse
database hvor sætninger og deres oversættelse er lagret parvis
https://dsn.dk/udgivelser/sprognaevnets-udgivelser/sprognaevnets-rapporter/sprogteknologi-i-verdensklasse
Ja
translation memory
parallelkorpus
korpus bestående af tekster på et sprog som sammenkobles med oversættelser til et andet sprog
http://www.ilc.cnr.it/EAGLES96/corpustyp/node20.html
Ja
parallel corpus
referencekorpus
korpus der udgør en antaget repræsentativ stikprøve af sproget
https://ja.dsl.dk/papers/CBS%202007/korpus-intro.pdf
Ja
reference corpus
rå sprogdata
sprogdata hvor den sproglige information ikke er bearbejdet, som ikke er grundigt strukturerede, og hvor det heller ikke er muligt at filtrere eller sammensætte teksterne efter bestemte kriterier
https://dsn.dk/udgivelser/sprognaevnets-udgivelser/sprognaevnets-rapporter/sprogteknologi-i-verdensklasse
Ja
raw language data
semantisk søgning
søgning der forsøger at finde resultatet baseret på betydningen af forespørgslen fremfor at matche en eksakt søgestreng
https://en.wikipedia.org/wiki/Semantic_search
Ja
semantic search
spamfiltrering
automatisk frasortering af uønskede mails
Fx baseret på automatisk emneklassifikation.
http://www.informationsordbogen.dk/concept.php?cid=7099
Nej
spam filtering
spontantale
tale der ikke er planlagt eller nedskrevet på forhånd
https://medical-dictionary.thefreedictionary.com/spontaneous+speech
Ja
spontaneous speech
sprogdata
data bestående af lagret tekst eller tale
Fx avisartikler, sms'er, manualer, optagelser af samtaler, oplæste tekster.
sprogteknologi.dk
Ja
language data
sprogforståelse
uddragelse af betydning fra tekst eller tale i naturligt sprog
https://www.iso.org/obp/ui/#iso:std:iso-iec:2382:ed-1:v1:en:term:2123786
Ja
natural language understanding
sprogmodel
statisk model over ord og ordsammensætningers hyppigheder på et givet sprog
https://sproget.dk/temaer/sprogteknologi/talesyntese-og-talegenkendelse
Ja
language model
sprogressource
ressource som kan anvendes til at løse en sprogrelateret opgave
Dette er et bredt begreb der dækker alt fra ordbørger og grammatikker til sprogdatasæt og korpora til sprogmodeller og suppertværktøjer med mere. Alt hvad der katalogiseres på sprogteknolgi.dk er fx sprogressourcer.
sprogteknologi.dk
Ja
language resource
sprogteknologi
teknologi der anvendes til at få computere til at bearbejde tekster eller udsagn på almindeligt menneskeligt sprog
Dvs. teknologier der kan analysere, genkende eller producere naturligt sprog.
https://denstoredanske.lex.dk/sprogteknologi;https://ordnet.dk/ddo/ordbog?query=sprogteknologi
Ja
language technology
sprogteknologisk infrastrukturkomponent
sprogressource i form af en genbrugelig komponent med et bestemt sprogteknologisk anvendelsesformål
sprogteknologi.dk
Ja
language technology infrastructure component
sprogteknologisk softwareløsning
sprogressource i form af en endelig sprogløsning der er målrettet slutbrugeren
Fx en talegenkender eller en chatrobot.
sprogteknologi.dk
Ja
language software solution
sprogteknologisk supportværktøj
værktøj, der understøtter indsamling og forarbejdning af sprogdata
Fx anonymisering, opmærkning eller analyse af indsamlet data.
https://www.researchgate.net/publication/334773144_Language_Technology_for_Icelandic_2018-2022
Ja
language support tool
sprogteknologisk værktøj og teknologi
samlebegreb for sprogteknologiske supportværktøjer og infrastrukturkomponenter
The META-SHARE Metadata Schema
Ja
language technology tool and technology
stemningsanalyse
sentimentanalyse
analyse af det emotionelle indhold i tekst og tale
https://dsn.dk/udgivelser/sprognaevnets-udgivelser/sprognaevnets-rapporter/sprogteknologi-i-verdensklasse
Ja
sentiment analysis
tale-til-tekst-løsning
talegenkendelses-løsning
løsning som er i stand til at registrere menneskelig tale og genkende de sagte ord
https://dsn.dk/udgivelser/sprognaevnets-udgivelser/sprognaevnets-rapporter/sprogteknologi-i-verdensklasse
Ja
speech-to-text service
talegenkendelse
automatisk genkendelse og omsætning til maskinlæsbar skrift af sproglyde i sammenhængende tale
Man konverterer typisk tale til skreven tekst.
https://denstoredanske.lex.dk/talegenkendelse
Ja
speech recognition
talesyntese
frembringelse af kunstig tale vha. elektronisk og elektro-akustisk teknik
Man konverterer typisk skreven tekst til tale.
https://denstoredanske.lex.dk/talesyntese
Ja
speech synthesis
taleteknologi
teknologi der anvendes ved en computers bearbejdning af talesignaler og tekst med det formål automatisk dels at genkende og forstå tale, talegenkendelse, dels at danne computerskabt tale, talesyntese
http://denstoredanske.dk/It,_teknik_og_naturvidenskab/Elektronik,_teletrafik_og_kommunikation/Kommunikationsteori_og_teletrafikteori/taleteknologi
Ja
speech technology
tekst-til-tale-løsning
talesynteseløsning
løsning som sætter en computer i stand til at efterligne et talende menneske
https://dsn.dk/udgivelser/sprognaevnets-udgivelser/sprognaevnets-rapporter/sprogteknologi-i-verdensklasse
Ja
text-to-speech service
tekstanalyse
analyse af tekst med henblik på at forstå dennes indhold
Formålet kan fx være at emneklassificere teksten, udtrække et resume eller stemningsanalyse.
https://dsn.dk/udgivelser/sprognaevnets-udgivelser/sprognaevnets-rapporter/sprogteknologi-i-verdensklasse
Ja
text analysis
tekstforslag
tekstforudsigelse
funktion hvor et system giver forslag til, hvilket ord eller tekststykke brugeren ønsker at skrive
Anvendes fx i tastaturprogrammer til mobiltelefoner og i oversættelseshukommelser.
https://dsn.dk/udgivelser/sprognaevnets-udgivelser/sprognaevnets-rapporter/sprogteknologi-i-verdensklasse
Ja
predictive text
tekstresumering
tekstsammenfatning
processen hvorved der skabes en kort oversigt over hovedtræk i fx en sag, noget sagt eller noget skrevet
https://ordnet.dk/ddo/ordbog?aselect=resum%C3%A9&query=resumering
Ja
text summarization
term
fagudtryk
ord eller udtryk med en fastlagt teknisk definition, brugt som betegnelse for et fagligt begreb
https://ordnet.dk/ddo/ordbog?query=term
Ja
term
termbase
termbank
database over fagord og deres betydning og anvendelse
https://sproget.dk/temaer/sprogteknologi/fagsprog-og-termbaser
Ja
term base
termekstraktion
termudtræk
identifikation og ekstraktion af termer fra løbende tekst
https://www.iso.org/obp/ui/#search
Ja
term extraction
tokeniser
tokeniseringsprogram; ordidentifikation
program der forbereder en tekst til videre behandling ved at identificere tegnsekvenser som ord
En token er en instans af en tegnsekvens i et bestemt dokument der sammenstillet kan behandles som en semantisk enhed - ofte betegnet ord eller termer.
https://nlp.stanford.edu/IR-book/html/htmledition/tokenization-1.html
Ja
tokenizer
transskription
tekstuel gengivelse af udtalte ord eller sammenhængende tale
Transskription kan i andre sammenhænge også bruges generelt om overførsel fra ét tegnsystem til et andet
https://denstoredanske.lex.dk/transskription_-_af_udtale_eller_tale
Ja
transcription
vidensmodellering
videnmodellering
udvikling af begrebsmodeller for et bestemt fagområde
https://dsn.dk/udgivelser/sprognaevnets-udgivelser/sprognaevnets-rapporter/sprogteknologi-i-verdensklasse
Ja
knowlegde modeling
Foretrukken dansk term |
Accepteret dansk term |
Definition | Kommentarer og eksempler | Kilde | Tilhører emne-område |
Foretrukken engelsk term |
---|---|---|---|---|---|---|
akustisk model | statistisk model over hyppigheder af sproglyde og deres sammensætninger på et givet sprog | En akustisk model bruges i taleteknologi til at repræsentere forholdet mellem lydsignaler og fonemer eller andre sproglige enheder, der udgør tale. | https://sproget.dk/temaer/sprogteknologi/talesyntese-og-talegenkendelse | Ja | acoustic model | |
algoritme | endelig liste af veldefinerede instruktioner for hvordan en given opgave skal løses | Et computerprogram udgøres fx af forbundne algoritmer beskrevet i programmeringssprog. | http://www.informationsordbogen.dk/concept.php?cid=2832 | Nej | algorithm | |
annotation | opmærkning; annotering | at forsyne ord og andre sprogelementer med metadata | Fx oplysninger om ordklasse eller udtale | https://dsn.dk/udgivelser/sprognaevnets-udgivelser/sprognaevnets-rapporter/sprogteknologi-i-verdensklasse | Ja | annotation |
annoterede sprogdata | sprogdata der er forsynet med metadata på tekstniveau samt på ordniveau | Fx grammatisk opmærkning på ordniveau | https://dsn.dk/udgivelser/sprognaevnets-udgivelser/sprognaevnets-rapporter/sprogteknologi-i-verdensklasse | Ja | annotated language data | |
begrebsmodel | model der beskriver begreber inden for et bestemt emneområde eller anvendelseskontekst og disse begrebers indbyrdes relationer | https://arkitektur.digst.dk/metoder/regler-begrebs-og-datamodellering | Nej | concept model | ||
BLARK | grundlæggende sprogressource-samling | samling af grundlæggende sprogressourcer der er nødvendige for at udvikle sprogteknologi for et givet sprog | http://www.blark.org/ | Ja | basic language resource kit | |
data statement | metadata om et datasæts oprindelse der har til formål at synliggøre bias i datasættet | Der er bl.a. tale om demografiske oplysninger om bidragsydere og dataindsamlere og om hvordan, datasættet er indsamlet. | https://www.aclweb.org/anthology/Q18-1041.pdf | Ja | data statement | |
datasæt | datasamling | samling af data, udgivet eller kurateret af en enkelt kilde og som er til råde for adgang til eller download af i en eller flere repræsentationer | Kurateret dækker her over udvælgelse og organisering. | http://www.w3.org/ns/dcat#Dataset | Nej | dataset |
digital assistent | virtuel personlig assistent | it-løsning som kan assistere og interagere med mennesker på en menneskelig måde | Fx chatbot | https://www.techopedia.com/definition/31383/intelligent-virtual-assistant | Ja | digital assistant |
dyb læring | superviseret læring | maskinlæring som opnås gennem træning på annoterede data | https://dsn.dk/udgivelser/sprognaevnets-udgivelser/sprognaevnets-rapporter/sprogteknologi-i-verdensklasse | Nej | deep learning | |
emneklassifika-tion | opdeling af en given genstandsmængde i klasser ud fra deres emnemæssige tilhørsforhold. | Emnebaseret kategorisering af ressourcer, fx klassificering af borger/kunde-henvendelser ift. hvilken afdeling der skal håndtere dem, inddeling af ressourcer ift. videnskabelig disciplin eller opmærkning af sager med typeinformation. | https://denstoredanske.lex.dk/klassifikation_-_ordning_i_klasser | Ja | subject classification | |
fonem | sproglyd med betydningsadskillende funktion | Alfabetet bygger i princippet på fonemer således, at hvert bogstav i princippet skulle repræsentere et fonem. Der er dog mange afvigelser fra det princip, fx udtrykkes a med forskellige fonemer i har og hat. | https://denstoredanske.lex.dk/fonem | Ja | phoneme | |
fonetik | læren om sprogets lydlige side | https://denstoredanske.lex.dk/fonetik | Ja | phonetics | ||
glosar | ordbog der indeholder betegnelser fra et eller flere domæner eller emneområder sammen med oversættelser til et eller flere sprog | https://www.iso.org/obp/ui/#iso:std:iso:1087:ed-2:v1:en:term:3.7.6 | Ja | glossary | ||
korpus | samling af tekst eller tale | The META-SHARE Metadata Schema | Ja | corpus | ||
kunstig intelligens | AI | algoritmer der ved at analysere og finde mønstre i data kan identificere den mest hensigtsmæssige løsning | https://www.regeringen.dk/media/6537/ai-strategi_web.pdf | Nej | artificial intelligence | |
leksikalsk ressource | sprogressource som repræsenterer leksikalsk eller begrebsmæssig viden | Fx ordbøger eller termdatabaser | The META-SHARE Metadata Schema | Ja | lexical resource | |
maskinlæring | proces der bruger algoritmer, der muliggør læring fra eksisterende data for at forudsige fremtidige resultater | https://www.iso.org/obp/ui/#iso:std:iso-iec:38505:-1:ed-1:v1:en:term:3.7 | Nej | machine learning | ||
maskinoversæt-telse | oversættelse fra et sprog til et andet foretaget af en computer | http://denstoredanske.dk/Sprog,_religion_og_filosofi/Sprog/Datalingvistik_og_sprogteknologi/Maskinovers%C3%A6ttelse | Ja | machine translation | ||
monolingval | vedrører, er skrevet på eller foregår på ét sprog | https://ordnet.dk/ddo/ordbog?query=monolingval | Ja | monolingual | ||
natursprog | naturligt sprog | naturligt opstået sprog der anvendes af mennesker til at kommunikere med hinanden | Modsat kunstige sprog, som fx esperanto eller programmeringssprog | https://www.collinsdictionary.com/us/dictionary/english/natural-language | Ja | natural language |
natursprogs-behandling | NLP | automatisk datalogisk behandling af naturligt sprog | https://towardsdatascience.com/natural-language-processing-nlp-for-machine-learning-d44498845d5b | Ja | natural language processing | |
navnegenkendelse | ner | identifikation af navne i løbende tekst | Kan inkludere klassifikation af typen af navn, fx person-, organisations- eller stednavn | https://towardsdatascience.com/named-entity-recognition-with-nltk-and-spacy-8c4a7d88e7da | Ja | named entity recognition |
nøgleordsanalyse | keywordanalyse | identifikation af de væsentligste indholdsord i en tekst ved statistisk analyse | https://www.moos-bjerre.dk/ydelser/noegleordsanalyse/ | Ja | keyword detection | |
ontologi | formel beskrivelse af begreber og sammenhænge inden for et bestemt område | http://www.informationsordbogen.dk/concept.php?cid=2274 | Ja | ontology | ||
ordbog | leksikalsk opslagsværk der indeholder oplysninger om ord og deres sproglige form og indhold, fx stavning, ordklasse, bøjning, udtale, betydning, brug, synonymer og historie i et sprog eller om ordenes oversættelse til et andet sprog | https://ordnet.dk/ddo/ordbog?query=ordbog | Ja | dictionary | ||
overfladeoriente-ret læring | ikke-superviseret læring | maskinlæring som opnås gennem træning på rådata | Står i modsætning til dyb læring (supervised learning) | https://dsn.dk/udgivelser/sprognaevnets-udgivelser/sprognaevnets-rapporter/sprogteknologi-i-verdensklasse | Nej | unsupervised learning |
oversættelses-hukommelse | database hvor sætninger og deres oversættelse er lagret parvis | https://dsn.dk/udgivelser/sprognaevnets-udgivelser/sprognaevnets-rapporter/sprogteknologi-i-verdensklasse | Ja | translation memory | ||
parallelkorpus | korpus bestående af tekster på et sprog som sammenkobles med oversættelser til et andet sprog | http://www.ilc.cnr.it/EAGLES96/corpustyp/node20.html | Ja | parallel corpus | ||
referencekorpus | korpus der udgør en antaget repræsentativ stikprøve af sproget | https://ja.dsl.dk/papers/CBS%202007/korpus-intro.pdf | Ja | reference corpus | ||
rå sprogdata | sprogdata hvor den sproglige information ikke er bearbejdet, som ikke er grundigt strukturerede, og hvor det heller ikke er muligt at filtrere eller sammensætte teksterne efter bestemte kriterier | https://dsn.dk/udgivelser/sprognaevnets-udgivelser/sprognaevnets-rapporter/sprogteknologi-i-verdensklasse | Ja | raw language data | ||
semantisk søgning | søgning der forsøger at finde resultatet baseret på betydningen af forespørgslen fremfor at matche en eksakt søgestreng | https://en.wikipedia.org/wiki/Semantic_search | Ja | semantic search | ||
spamfiltrering | automatisk frasortering af uønskede mails | Fx baseret på automatisk emneklassifikation | http://www.informationsordbogen.dk/concept.php?cid=7099 | Nej | spam filtering | |
spontantale | tale der ikke er planlagt eller nedskrevet på forhånd | https://medical-dictionary.thefreedictionary.com/spontaneous+speech | Ja | spontaneous speech | ||
sprogdata | data bestående af lagret tekst eller tale | Fx avisartikler, sms'er, manualer, optagelser af samtaler, oplæste tekster | sprogteknologi.dk | Ja | language data | |
sprogforståelse | uddragelse af betydning fra tekst eller tale i naturligt sprog | https://www.iso.org/obp/ui/#iso:std:iso-iec:2382:ed-1:v2:en:term:2123786 | Ja | natural language understanding | ||
sprogmodel | statistisk model over ord og ordsammensætningers hyppigheder på et givet sprog | https://sproget.dk/temaer/sprogteknologi/talesyntese-og-talegenkendelse | Ja | language model | ||
sprogressource | ressource som kan anvendes til at løse en sprogrelateret opgave | Dette er et bredt begreb der dækker alt fra ordbørger og grammatikker til sprogdatasæt og korpora til sprogmodeller og suppertværktøjer m.m. Alt hvad der katalogiseres på sprogteknolgi.dk er fx sprogressourcer. | sprogteknolgi.dk | Ja | language resource | |
sprogteknologi | teknologi der anvendes til at få computere til at bearbejde tekster eller udsagn på almindeligt, menneskeligt sprog | Dvs. teknologier, der kan analysere, genkende eller producere naturligt sprog. | https://denstoredanske.lex.dk/sprogteknologi | Ja | language technology | |
sprogteknologisk infrastrukturkom-ponent | sprogressource i form af en genbrugelig komponent med et bestemt sprogteknologisk anvendelsesformål | sprogteknologi.dk | Ja | language technology infrastructure component | ||
sprogteknologisk softwareløsning | sprogressource i form af en endelig sprogløsning der er målrettet slutbrugeren | Fx en talegenkender eller en chatrobot | sprogteknologi.dk | Ja | language software solution | |
sprogteknologisk supportværktøj | værktøj, der understøtter indsamling og forarbejdning af sprogdata | Fx anonymisering, opmærkning eller analyse af indsamlet data | https://www.researchgate.net/publication/334773144_Language_Technology_for_Icelandic_2018-2022 | Ja | language support tool | |
sprogteknologisk værktøj og teknologi | samlebegreb for sprogteknologiske supportværktøjer og infrastrukturkomponenter | The META-SHARE Metadata Schema | Ja | language technology tool and technology | ||
stemningsanalyse | sentimentanalyse | analyse af det emotionelle indhold i tekst og tale | https://dsn.dk/udgivelser/sprognaevnets-udgivelser/sprognaevnets-rapporter/sprogteknologi-i-verdensklasse | Ja | sentiment analysis | |
tale-til-tekst-løsning | talegenkendelses-løsning | løsning som er i stand til at registrere menneskelig tale og genkende de sagte ord | https://dsn.dk/udgivelser/sprognaevnets-udgivelser/sprognaevnets-rapporter/sprogteknologi-i-verdensklasse | Ja | speech-to-text service | |
talegenkendelse | automatisk genkendelse og omsætning til maskin-læsbar skrift af sproglyde i sammenhængende tale | Man konverterer typisk tale til skreven tekst. | https://denstoredanske.lex.dk/talegenkendelse | Ja | speech recognition | |
talesyntese | frembringelse af kunstig tale vha. elektronisk og elektro-akustisk teknik | Man konverterer typisk skreven tekst til tale. | https://denstoredanske.lex.dk/talesyntese | Ja | speech synthesis | |
taleteknologi | teknologi der anvendes ved en computers bearbejdning af talesignaler og tekst med det formål automatisk dels at genkende og forstå tale, talegenkendelse, dels at danne computerskabt tale, talesyntese | http://denstoredanske.dk/It,_teknik_og_naturvidenskab/Elektronik,_teletrafik_og_kommunikation/Kommunikationsteori_og_teletrafikteori/taleteknologi | Ja | speech technology | ||
tekst-til-tale-løsning | talesynteseløsning | løsning som sætter en computer i stand til at efterligne et talende menneske | https://dsn.dk/udgivelser/sprognaevnets-udgivelser/sprognaevnets-rapporter/sprogteknologi-i-verdensklasse | Ja | text-to-speech service | |
tekstanalyse | analyse af tekst med henblik på at forstå dennes indhold | Formålet kan fx være at emneklassificere teksten, udtrække et resumé eller stemningsanalyse. | https://dsn.dk/udgivelser/sprognaevnets-udgivelser/sprognaevnets-rapporter/sprogteknologi-i-verdensklasse | Ja | text analysis | |
tekstforslag | tekstforudsigelse | funktion hvor et system giver forslag til, hvilket ord eller tekststykke brugeren ønsker at skrive | Anvendes fx i tastaturprogrammer til mobiltelefoner og i oversættelseshukommelser. | https://dsn.dk/udgivelser/sprognaevnets-udgivelser/sprognaevnets-rapporter/sprogteknologi-i-verdensklasse | Ja | predictive text |
tekstresumering | tekstsammen-fatning | processen hvorved der skabes en kort oversigt over hovedtræk i fx en sag, noget sagt eller noget skrevet | https://ordnet.dk/ddo/ordbog?aselect=resum%C3%A9&query=resumering | Ja | text summarization | |
term | fagudtryk | ord eller udtryk med en fastlagt teknisk definition, brugt som betegnelse for et fagligt begreb | https://ordnet.dk/ddo/ordbog?query=term | Ja | term | |
termbase | termbank | database over fagord og deres betydning og anvendelse | https://sproget.dk/temaer/sprogteknologi/fagsprog-og-termbaser | Ja | term base | |
termekstraktion | termudtræk | identifikation og ekstraktion af termer fra løbende tekst | https://www.iso.org/obp/ui/#search | Ja | term extraction | |
tokeniser | tokeniserings-program; ordidentifikation | program der forbereder en tekst til videre behandling ved at identificere tegnsekvenser som ord | Et token er en instans af en tegnsekvens i et bestemt dokument, der sammenstillet kan behandles som en semantisk enhed - ofte betegnet ord eller termer. | https://nlp.stanford.edu/IR-book/html/htmledition/tokenization-1.html | Ja | tokenizer |
transskription | tekstuel gengivelse af udtalte ord eller sammenhængende tale | Transskription kan i andre sammenhænge også bruges generelt om overførsel fra ét tegnsystem til et andet. | https://denstoredanske.lex.dk/transskription_-_af_udtale_eller_tale | Ja | transcription | |
vidensmodel-lering | videnmodellering | udvikling af begrebsmodeller for et bestemt fagområde | https://dsn.dk/udgivelser/sprognaevnets-udgivelser/sprognaevnets-rapporter/sprogteknologi-i-verdensklasse | Ja | knowlegde modeling |