Språkvelger

English

NorwAI

En guide til NorwAI’s arbeid med store språkmodeller på norsk

En guide til NorwAI’s arbeid med store språkmodeller på norsk

NorLLM

NorLLM

SFI NorwAI – Norsk forskningssenter for AI-innovasjon – arbeider intenst med å utvikle generative språkmodeller som kan komme det norske samfunnet til nytte. Generative språkmodeller kom på alles lepper i 2023 etter det internasjonale gjennombruddet av denne type bruk av kunstig intelligens.

I denne seksjonen oppsummerer vi status for NorwAIs arbeid så langt med NorLLM (Norwegian Large Language Models).

Vårt nøkkelbudskap:

Norge trenger kontroll på egne generative språkmodeller bygd på norske data og verdier
Vi har et velfungerende system for innsamling og forvaltning av publisert innhold for bruk i store språkmodeller
Norge mangler beregningsressurser til både trening og drift av store språkmodeller
Det trengs strukturer og mekanismer for å sikre at treningsdata, finjusteringsdata og tilpasningsrutiner understøtter norske verdier og åpne modeller
NorwAI har den nødvendige kompetansen og erfaringene og ønsker å utvikle norske språkmodeller for det norske samfunnet.

NorLLM-modellene

Få tilgang til modellene

NorLLM logo Modellene er tilgjengelige for testing, for representanter fra organisasjoner basert i Norden og studenter ved nordiske universiteter. Søk om tilgang til NorLLM-modellene på Hugging Face: https://huggingface.co/NorwAI

Kontakt

Kontakt

person-portlet

Tekniske henvendelser

person-portlet

Om språkmodeller generelt

Terje Brasethvik
Førsteamanuensis

person-portlet

Andre henvendelser

Nyheter

Nyheter

En presentasjon av NorLLM-prosjektet, som arbeider med store språkmodeller basert på norske data og verdier, på en konferanse i Trondheim. På skjermen vises informasjon om lanseringen av modellene og logoene til NorwAI og NTNU.

Nasjonal lansering av neste generasjon NorLLM-modeller

Den 15. mai vil NorwAI presentere og lansere neste generasjon av sine NorLLM-modeller. Næringsminister Cecilie Myrseth deltar og ønsker publikum velkommen når NorwAI lanserer sine nye språkmodeller. Statsråden vil snakke om hennes forventninger til bruken av språkmodeller. I tillegg vil en gruppe partnere, samarbeidende selskaper og organisasjoner presentere prosjekter og planer for bruken av modellene.

Møte om kunstig intelligens med NorwAI-logoen synlig.

Språkmodeller tar av

Aktivitetene rundt norske språkmodeller fikk nasjonal oppmerksomhet i 2023. Interessen fortsetter inn i 2024. Vår offentlige introduksjon til å presentere store norske språkmodeller fant sted under ‘Arendalsuka’ 17. august 2023.

Tre personer foran serverrekker.

Fire modeller bygget – fire nye på beddingen

NorwAI har bygd fire ulike norske generative språkmodeller. I vinter og i vår 2024 bygges ytterligere fire modeller som gjøres tilgjengelige etter påske i år. Samlet sett utgjør alle de åtte modellene trinn på veien mot NorwAIs ambisjon om å bygge en fullverdig generativ grunnmodell for allmenn bruk i størrelsesorden 40 milliarder parametre i løpet av 2024.

Diskusjon ved whiteboard i et kontormiljø

Lærdommer om språkmodeller: Noen observasjoner fra arbeidet med språkmodeller

Arbeidet med språkmodeller har avdekket en del interessante aspekter knyttet til transparensm, bærekraft, verider og normer, og målformer.

Fire personer i et møterom

Kva kreves for å trene og drifte språkmodeller?

Dersom en skal bygge opp et miljø for trening og drift av norske, kommersielt tilgjengelige språkmodeller, må en ha tilgang ressurser.

Portrettbilde av Karl Aksel Festø

Etterspurte anvendelser

Det siste året har NorwAI blitt kontaktet av flere offentlige virksomheter og private foretak som ønsker et alternativ til de internasjonale modellene. De har i hovedsak hatt to ankepunkter mot de eksisterende, kommersielle modellene: i) håndtering av sensitive og opphavsrettslig beskyttede data, ii) manglende kvalitet på norsk.

En person presenterer foran en uskarp skjerm.

Språkrådet om fagkompetent generativ språkteknologi

Nå som generative språkmodeller har vist seg å kunne skrive relativt flytende hverdagsnorsk, må vi tørre å sette forventningene til maskinene enda høyere. For at modellene trygt kan brukes til profesjonelle formål på alle samfunnsområder, må de også kunne håndtere og produsere fagspesifikt språk og spesialisert terminologi for disse samfunnsområdene på en korrekt, forutsigbar og pålitelig måte. I maskinlæringens tidsalder betyr det at det trengs relevant treningsdata fra alle fagfelt. Av Åse Wetås, Direktør, Språkrådet

Portrettbilde av Anders Løland

Hvordan kan Norw(AI) beskytte personlige data?

Å beskytte personlig informasjon er utfordrende med komplekse AI-modeller som er sultne på data. NorwAIs løfte om å gi en individualisert AI-opplevelse som beviselig respekterer personvernhensyn er derfor viktigere enn noen gang. Anders Løland, Forskningssjef Norsk Regnesentral (NR)

En illustrasjon av en person som chatter med en AI chatbot på datamaskinen sin

Skadelig oppførsel i språkmodeller

Svarene fra en språkmodell reflekterer hvilke data som går inn i treningssettet. Hvis treningsdataene er mangelfulle, vil modellen kombinere ord etter statistiske sannsynligheter og konstruere setninger som kan være både plausible og grammatisk gode, men som har lite med virkeligheten å gjøre.

Portrettbilde av Aslak Sira Myhre

Prosjekt «MIMIR» evaluerer verdien av opphavsrett

På tampen av 2023 kom initiativet som fikk de tre mest aktive miljøene i Norge med kompetanse på språkmodeller til å samarbeide tettere. Prosjektet “Mimir” forente Nasjonalbiblioteket, Universitetet i Oslo og NorwAI i en felles anstrengelse.

En person presenterer TrustLLM-målene på en konferanse.

TrustLLM - Et EU-prosjekt som svar på generative AI-hallusinasjoner

De siste to årene har generativ AI sett fremveksten. Mange modeller har nyttige funksjoner, men har en tendens til å finne på fakta og reagere altfor selvsikkert. Hvordan redusere denne risikoen? I november 2023 startet et konsortium med partnere fra Norge, Tyskland, Sverige, Island, Danmark og Nederland det Horizon Europe-finansierte prosjektet TrustLLM for å utvikle åpne, pålitelige og bærekraftige store språkmodeller.