99 ressourcer fundet

Filtrér resultater
  • Open-source Python-pakke til dansk talegenkendelse (tale-til-tekst). DanSpeech har arbejdet på at udvikle generelle talegenkendelsesmodeller siden 2018. Projektet har levet som...
  • Genereret automatisk fra DDO. Ord + oplysning om 1-2 synonymer (1,6 synonymer pr. ordbetydning i gmsnt.) OBS: Licensbetingelserne for anvendelse af denne ressource er under...
  • Ordliste med lemmaer og deres bøjningsformer inkl. POS: Hver form er særskilt forsynet med ordklasse- og bøjningsoplysning. OBS: Licensbetingelserne for anvendelse af denne...
    • ZIP
  • Komma opdelt fil med fire ord på hver linje, hvor det fjerde ord er en semantisk outlier. Licens: https://www.apache.org/licenses/LICENSE-2.0
    • CSV
  • Dansk oversættelse af WordSim-353-word similarity datasættet som vedligeholdes af Evgeniy Gabrilovich. Licens: https://www.apache.org/licenses/LICENSE-2.0
    • CSV
  • DGT-TM er en oversættelseshukommelse (sætninger og deres manuelt fremstillede oversættelse) på 24 sprog. Den indeholder segmenter fra den gældende fællesskabsret –...
    • ZIP
    • PDF
  • Danish Named Place data contain names on everything from the tree “Konge egen” and the city center to the peninsula Jutland. There are 140,000 Danish Named Places in total, all...
    • INSPIRE-ATOM
    • OGC:WMS-1.3.0-http-get-map
  • CST's tokeniserings- og segmenteringsprogram til tekst- og RTF-filer. Opdeler en tekst i ord og ordforbindelser
  • Data fra det Centrale Virksomhedsregister (CVR), som er statens register for virksomhedsoplysninger. CVR indeholder grunddata om virksomheder og deres...
  • CoREST er et værktøj til sproglige undersøgelser i meget store tekstsamlinger, såkaldte tekstkorpusser. CoREST står for Corpus Retrieval System and Tools. OBS! CoREST kan ikke...
  • List of a limited number of Danish compound words. Each line lists a word with one or more vertical bar as the separator between the individual parts of the compound word....
    • TXT
  • The Copenhagen Dependency Treebanks are a set of treebanks for Danish, English, Spanish and Italian. The purpose of the Copenhagen Dependency Treebank project is to create...
    • ZIP
    • TAR
  • J.C.S. Espersen: Bornholmsk Ordbog, 1908, Inclusive Lydlære af Vilh. Thomsen og bøjningslære af Ludv. F.A. Wimmer. BCP-47: da-DK-bornholm.
    • PDF
  • Udtale af ord med bornholmsk dialekt. BCP-47: da-DK-bornholm.
  • 28.000 stednavne i Danmark der har en stavemåde som er autoriseret af Kulturministeriet som gældende retskrivning. Navnene kan fremsøges via applikationen stednavne.info hvis...
    • XLSX
  • CST's lemmatiser fører hvert ord i en tekst tilbage til grundformen, lemmaet.
  • ML Powered Danish Sentiment Model License: MIT License - https://opensource.org/licenses/MIT
  • KOMMER SNART: FT speech is a corpus of recorded meetings of the Danish Parliament, otherwise known as the Folketing (FT). The corpus contains over 1,800 hours of transcribed...
  • This resource is an annotation of four NER types (PER, ORG, LOC, MISC) on top of the UD_Danish-DDT data. Status: published and freely available since summer 2019 Reference:...
  • The Danish Universal Dependencies treebank (Johannsen et al., 2015, UD-DDT) is a conversion of the Danish Dependency Treebank (Buch-Kromann et al. 2003) based on texts from...