Borealium
    See more results
    Englishen
    • Dansk
    • Davvisámegiella
    • English
    • Føroyskt
    • Íslenska
    • Julevsámegiella
    • Kalaallisut
    • Meänkieli
    • Norsk, bokmål
    • Norsk, nynorsk
    • Nuõrttsääʹmǩiõll
    • Suomi
    • Svenska
    • Åarjelsaemien gïele
    Category

    Korp

    Corpus resources presented in the Korp web interface.

  • Korp for Meänkieli

    In Korp for Meänkieli, you can search for Meänkieli texts. The text corpus is grammatically annotated.

  • Korp for Kven

    In Korp for Kven you can search Kven texts. The text corpus is grammatically annotated.

  • Korp for Inari Sámi

    In Korp for Inari Sámi you can search Inari Sámi texts. The text corpus is grammatically annotated.

  • Icelandic Korp

    The Icelandic Korp Instance contains five different corpora: MÍM (The Icelandic tagged corpus - 25M words) The Icelandic Frequency Dictionary (500K words), The Saga Corpus (1.5M words from the text of the sagas), ParIce (An English-Icelandic parallel corpus (over 40M words in each language) and all versions of the Icelandic Gigaword Corpus (approx. 2.5B words in the latest version).

  • Korp for Faroese

    In Korp for Faroese you can search Faroese texts. The text corpus is grammatically annotated.

  • Korp for Skolt Sámi

    In Korp for Skolt Sámi you can search Skolt Sámi texts. The text corpus is grammatically annotated.",

  • Korp for South Sámi

    In Korp for South Sámi you can search South Sámi texts. The text corpus is grammatically annotated.

  • Korp for North Sámi

    In Korp for North Sámi you can search North Sámi texts. The text corpus is grammatically annotated.

  • Korp for Lule Sámi

    In Korp for Lule Sámi you can search Lule Sámi texts. The text corpus is grammatically annotated.

  • News

    Nå kan datamaskiner for første gang snakke sørsamisk — på 100-årsdagen til stemmegiveren

    UiTs samiske språkteknologimiljø har laget en sørsamisk talesyntese basert på arkivmateriale av taleren, i samarbeid med Samisk arkiv – Arkivverket. Dette kan bidra til å bevare det unike språket.

    Read more

    Nå kan datamaskiner for første gang snakke lulesamisk

    UiTs samiske språkteknologiutviklere har nemlig laget en lulesamisk talesyntese med tre kunstige stemmer. Dette kan bidra til å bevare det unike språket.

    Read more

    Vad är språkteknologi för små språk?

    Vad är språkteknologi och vad används det till? Och varför saknas det teknologi för små språk? Trond Trosterud, professor i samiska språk vid Giellatekno på universitet i Tromsö, Norge berättar varför språkteknologiska verktyg är viktiga för att kunna läsa, skriva, förstå och prata små språk i Norden.

    Read more

    Copyright © ⁨2025⁩ UiT The Arctic University of Norway

    Information
    • About Borealium
    • Privacy
    • GitHub
    Documentation
    • Maintaining this website
    UiT The Arctic University of Norway

    PO Box 6050 Langnes

    N-9037 Tromsø

    Norway