Spør eksperten

Språkmodellene i ChatGPT

Språkmodellene som brukes av ChatGPT endrer seg stadig vekk. Flere ganger i året lanseres nye modeller, eller nye varianter av eksisterende modeller. Mye av den grunnleggende teknologien er imidlertid den samme. Språkmodellene vi bruker i dag kan grovt sett deles inn i tre typer: Grunnmodeller, mini-modeller og resonnerende modeller.

Grunnmodellene er «arbeidshestene» blant språkmodellene. De er trent på enorme mengder tekst, og kan både analysere og generere tekst. Grunnmodellene svarer godt på de fleste oppgavene vi vanligvis bruker språkmodeller til.

De største grunnmodellene er multimodale. Det betyr at de kan behandle bilder og lyd også, i tillegg til tekst.

Språkmodeller forstår egentlig ikke hva du skriver. De er matematiske modeller, som beregner hvilke ord som hører sammen i ulike sammenhenger. Ved å analysere enorme mengder tekst under treningen, har beregningene blitt så gode at teksten modellene genererer ser ut som at den er skrevet av et menneske.

For å forstå betydningen av teksten, gjør modellene om ord og setninger til verdier. Ordene gjøres om til Tokens, som representeres av en tallverdi, og betydningen av ordene representeres av tusenvis av tall, eller Vektorer, som til sammen angir betydningen av et ord eller en setning.

Hvis jeg stiller spørsmålet «Hvor høyt er Tryvannstårnet?», blir spørsmålet mitt omgjort til et sett vektorer. ChatGPT søker i treningsdataene sine, på internett eller i andre kilder etter setninger som har vektorsett som er mest mulig lik spørsmålet mitt.

Setningen «Tryvannstårnet er et tårn i betong og stål med en total høyde på 118 meter» fra Store Norske Leksikon har et vektorsett som er ganske likt spørsmålet mitt. Da kan ChatGPT bruke innholdet i den setningen til å formulere et svar på spørsmålet mitt.

Resonnerende modeller lages også med utgangspunkt i grunnmodellene. Grunnmodellene forsøker å løse oppgavene du gir dem på første forsøk. Det fungerer fint på de fleste enkle oppgaver, men på komplekse oppgaver, for eksempel innen koding, matematikk og research, gir ikke dette alltid de beste resultatene.

De resonnerende modellene blir trent spesielt på å dele opp komplekse oppgaver i mindre deloppgaver, og så løse deloppgavene hver for seg. I tillegg får de resonnerende modellene lov til å bruke lenger tid på hver oppgave, noe som også gir bedre resultater.

Til sammen gjør dette at de resonnerende modellene gir bedre svar på komplekse oppgaver, enn det grunnmodellene gir. På enklere oppgaver, derimot gir grunnmodellene best svar.

Mini-modellene er grunnmodellenes småsøsken. Ved å ta utgangspunkt i grunnmodellene (eller de resonnerende modellene), og ta bort en del av den bredeste kunnskapen, får man modeller som fortsatt generer bra språk og har kunnskap om mye, men som er mye mindre. I tillegg til å være små, og dermed billigere i bruk, er disse mini-modellene også mye raskere enn de store grunnmodellene og resonnerende modellene.

Minimodellene egner seg godt til mange hverdagslige oppgaver som ikke krever den brede kunnskapen de store modellene har. Chatboter og enkel språkbehandling er eksempler på oppgaver mini-modellene kan brukes til.

ChatGPT bruker ulike språkmodeller, og betalende abonnenter kan velge mellom flere modeller basert på behov og oppgavetype. Gratisbrukere har ikke dette valget og får automatisk tilgang til den modellen som ChatGPT selv anser som mest passende.

Her er en oversikt over modellene som for øyeblikket er tilgjengelige:

GPT-5

ChatGPT med GPT-5
ChatGPT med GPT-5

GPT-5 er den nyeste generasjonen modeller fra OpenAI. Med GPT-5 introduserte OpenAI også en automatisk modellevelger, som gjør at brukeren slipper å vurdere hvilken variant av GPT-5 som egner seg best til den enkelte oppgave. Man gir oppgaven til GPT-5, så vil den automatiske modellvelgeren analysere oppgaven, og sende den til den riktige varianten av GPT-5.

GPT-5 gir litt mer konkrete og formelle svar enn sine forgjengere, men OpenAI har lovet at de som foretrekker en litt mer "varm og personlig" tone fra GPT-5 skal få mulighet til å tilpasse den etter hvert. GPT-5 skal også være bedre på koding og design enn tidligere modeller, og den skla hallusinere mindre.

GPT-5 kommer i flere ulike varianter:

  • Auto bruker den automatiske modellvelgeren til å sende oppgaven din til riktig variant av GPT-5
  • Fast er den raske, ikke-resonnerende grunnmodellen
  • Thinking mini er en liten, og litt raskere versjon av den resonnerende modellen
  • Thinking er den resonnerende modellen
  • Pro er den resonnerende modellen med ekstra ressurser, som gjør den enda bedre

GPT-4.1

GPT-4.1 er en grunnmodell som er en videreutvikling av GPT-4o. Den er blant annet bedre på koding enn 4o. Den største forskjellen er imidelrtid at GPT-4.1 har et kontekstvindu på hele én million tokens. Det vil si at den kan håndtere mye mer informasjon når den løser opgaver. Med et stort kontekstvindu kan modellen behandle ekstra mye bakgrunnsinformasjon, og den kan holde lengre samtaler i gang uten at minnet blir fullt.

GPT-4o

GPT-4o var OpenAIs flaggskipmodell før lanseringen av GPT-4.5. Det var den første omfattende multimodale grunnmodellen som ble tilgjengelig, og representerte et betydelig fremskritt da den ble lansert.

GPT-4o egner seg svært godt til generelle og varierte oppgaver, og behandler sømløst både tekst, bilder og lyd.

o4-Mini (Low, Medium, High)

o4-Mini-serien var OpenAIs nyeste generasjon resonnerende modeller før GPT-5 ble lansert. Disse modellene spesialiserer seg på avansert resonnering og problemløsing, inkludert koding, matematikk og research. o4-Mini er en videreutvikling av den tidligere o3-Mini og kommer i tre ytelsesnivåer:

  • Low: For enklere resonnerende oppgaver.
  • Medium: For middels komplekse oppgaver.
  • High: Leverer resultater på nivå med eller bedre enn tidligere toppmodeller, til tross for at modellen er betydelig mindre.

o4-Mini kan resonnere med bilder. Det vil si at den kan tolke bilder du laster opp, i tillegg til teksten du skriver i prompten. Den kan også bruke flere av verktøyene i ChatGPT, som websøk, kjøring av datakode og bildegenerering.

o4-Mini High egner seg spesielt godt til krevende oppgaver hvor høy presisjon og avansert resonnering er nødvendig.

o3

o3 var OpenAIs mest avanserte resonnerende modell før GPT-5 ble lansert. Modellen er optimalisert for å dele komplekse problemer inn i mindre steg gjennom en prosess kjent som "tankerekke-resonnering" (chain-of-thought reasoning). o3 bruker lengre tid på å bearbeide informasjonen, noe som gir svært høy presisjon og evne til å håndtere komplekse oppgaver innen koding, matematikk, forskning og detaljert analyse.

o3 kan resonnere med bilder. Det vil si at den kan tolke bilder du laster opp, i tillegg til teksten du skriver i prompten. Den kan også bruke flere av verktøyene i ChatGPT, som websøk, kjøring av datakode og bildegenerering.

--- --- ---

Tidligere modeller

GPT-4.5

GPT-4.5 var opprinnelig tenkt å skulle bli GPT-5. Den var imidlertid ikke et stort nok steg fremover til at det forsvarte å definere den som en ny generasjon modeller. I tillegg var den ekstremt ressurskrevende, og ble derfor pensjonert etter kort tid. Modellen var multimodal, noe som betyr at den håndtererte både tekst, bilder og lyd. GPT-4.5 var trent på enorme mengder data og hadde et mer naturlig, nyansert og empatisk språk enn tidligere modeller. Den hadde også betydelig redusert tendens til såkalt «hallusinering» (feilinformasjon eller usanne utsagn).

GPT-4o Mini

GPT-4o Mini er en mindre og mer effektiv versjon av GPT-4o, med tilsvarende funksjonalitet, men begrenset størrelse og kapasitet. Den passer best til enklere oppgaver hvor rask respons og lavere kostnader er viktigere enn maksimal ytelse.

Les mer: Slik virker kunstig intelligens

Les mer: Slik trenes kunstig intelligens

Les mer: Resonnerende språkmodeller

Les mer: ChatGPT

Les mer: Perplexity


ChatGPT kurs