Ord og uttrykk

Når vi snakker om kunstig intelligens, er det mange ord og uttrykk som brukes, men som mange kanskje ikke vet helt hva betyr. Her er en forklaring på en hva en del av de vanligste ordene og uttrykkene innen kunstig intelligens betyr.

Generativ kunstig intelligens

Generativ kunstig intelligens er en fellesbetegnelse på KI-modeller som kan skape unikt innhold. I dag har vi generative modeller kan skape tekst, bilder, lyd og video. Det forskes også på modeller som kan generere medisiner, vaksiner og biologisk materiale.

Kjente verktøy som ChatGPT, Google Gemini, DALL-E og Midjourney er eksempler på generativ kunstig intelligens.

Generativ kunstig intelligens trenes på store mengder eksisterende innhold, og bruker det den lærer til å generere nytt innhold. Ved å gi modellen frihet til å være kreativ, kan den skape innhold som ikke finnes i treningsdataene.

Denne kreativiteten er også det som fører til at språkmodeller av og til gir uriktige svar på faktaspørsmål, det vi kaller hallusinering.

Generell kunstig intelligens

Artificial General Intelligence (AGI).

Det finnes ingen entydig definisjon på hva generell kunstig intelligens er. Beskrivelsen av generell kunstig intelligens varierer fra KI som kan lære seg ting på egen hånd, til KI som er mer intelligent enn et menneske.

Det er også stor uenighet blant ekspertene om hvor langt unna generell kunstig intelligens vi er. Enkelte mener at dagens store språkmodeller begynner å nærme seg generell kunstig intelligens, noen mener at det fortsatt er mange år til kunstig intelligens nærmer seg dette stadiet, mens andre igjen mener at vi ikke vil komme dit i overskuelig fremtid.

Hallusinering

Når du ber en AI-modell om å svare på noe den ikke finner i treningsdataene sine, vil den likevel forsøke å gi deg et svar. Ved hjelp av det den er trent på, vil den forsøke å sette sammen et svar som ligger så nært opp til det du ba om som mulig. Hvis du har stilt et faktaspørsmål, kan det hende at svaret er feil. Det kaller vi hallusinering.

Hallusinering er ikke en feil i modellen. Det er tvert imot det som gjør modellen i stand til å være kreativ. Hvis du ber den om å skrive et dikt om roboter, slik Henrik Ibsen ville ha skrevet det, er det hallusinering som gjør at modellen klarer å lage et imponerende dikt til deg.

Du kan lese mer om hallusinering her.

Kontekstvindu

Kontekstvindu angir hvor mye informasjon en språkmodell kan ta hensyn til når den behandler en forespørsel.

Med et langt kontekstvindu, vil modellen kunne behandle store megnder bakgrunnsinformasjon når den responderer på en forespørsel. En modell med et langt kontekst vindu vil også kunne "holde tråden" i lengre samtaler, og besvare mer komplekse forespørsler.

Samtidig vil et langt kontekstvindu gjøre at modellen krever mer regnekraft og større ressurser for å fungere.

De fleste store språkmodeller har i skrivende stund et kontekstvindu på 32 000 til 200 000 tokens. Googles Gemini 1.5 Pro skal i løpet av året (2024) få et kontekstvindu på 2 millioner tokens. Det tilsvarer omtrent 1,4 millioner ord, 22 timer lyd eller 2 timer video.

Parametre (modellparametre)

Antall parametre i en AI-modell sier noe om hvor stor den er. Det nevrale nettverket som modellen er laget på består av tusenvis av noder som er knyttet sammen. Hver node har en verdi vi kaller "bias", og hver sammenkobling har en verdi vil kaller "vekt". Det er disse verdiene som justeres når vi trener modellen.

Antall modellparametre i en kunstig intelligens-modell er summen av antall vekter og biaser.

Temperatur

Temperatur i kunstig intelligens, er en parameter som bestemmer hvor kreativ en språkmodell skal være. Temperaturen er et tall mellom 0 og 1, hvor 0 er lite kreativ og 1 er veldig kreativ. En høy temperatur er bra hvis du vil at språkmodellen skal være kreativ, og finne på nye ting, mens en lav temperatur er best for faktaspørsmål og analyse. En høy temperatur øker risikoen for at modellen hallusinerer når du stiller faktaspørsmål.

I ChatGPT er temperaturen satt til 0,7 fast, og kan ikke justeres. Du kan imidlertid påvirke kreativiteten gjennom instruksjonene du gir i prompten. Tilsvarende gjelder for Google Gemini og andre chatboter. Bruker du språkmodellenes programmeringsgrensesnitt (API), kan du justere temperaturen selv.

Teknisk sett justerer temperaturen hvor flat eller spiss sannsynlighetskurven er når modellen skal velge neste token. En lav temperatur øker sjansen for at det tokenet med høyest sannsynlighet blir valgt, mens en høy temperatur gir en flatere kurve, som øker sjansen for at et annet token enn det mest sannsynlige blir valgt.

Token

Token er en enhet med tekst som behandles av en språkmodell. En token kan være et ord eller en del av et ord. Tokens gjør det mulig for modeller å jobbe mer effektivt og nøyaktig ved å dele tekst opp i håndterbare biter.

Hvordan ord gjøres om til tokens avgjøres av en tokeniseringsalgoritme. Det finnes ulike tokeniseringsalgoritmer, som er optimalisert for ulike typer språkmodeller.

Når språkmodellen behandler eller genererer tekst, er det tokens den arbeider med.

Vektorer

Vector embeddings.

Vektorer er sett med verdier som beskriver egenskapene til et objekt. Alle datatyper kan konverteres til en vektorrepresentasjon (et sett med vektorer), både tekst (ord, setninger, avsnitt), bilder, produkter og så videre. Et objekt kan ha tusenvis av vektorer.

Hver vektor har en verdi mellom 1 og -1, som angir i hvor stor grad objektet har den aktuelle egenskapen.

Objektet konverteres til vektorrepresentasjon av spesielle KI-basert vektormodeller. Det finnes flere forskjellige vektormodeller, tilpasset ulike datatyper og bruksområder.

Vektorene gjør det mulig å beskrive veldig komplekse data på en enkelt måte, og sammenligne for eksempel den semantiske betydningen av tekst, innholdet i bilder eller produkter med liknende egenskaper.

Du kan lese mer om vektorer her.

Vektordatabase

En vektordatabase er en database som er spesielt godt egnet til å lagre, sammenligne og finne objekter basert på vektorer. Objektene (tekst, bilder, produkter osv.) lagres sammen med alle de tilhørende vektorene i databasen.

For å søke etter et lignende objekt, sender man en forespørsel bestående av alle vektorene til objektet man vil sammenligne med. Databasen regner ut hvilke objekter som har vektorer som er nærmest, og returnerer de beste resultatene.

Vektordatabaser egner seg godt til oppgaver som språkbehandling, bildesøk, anbefalingssystemer, avvikskontroll, ansiktsgjenkjenning og så videre.

Les mer: Slik virker kunstig intelligens

Les mer: Resonnerende språkmodeller

Les mer: ChatGPT

Les mer: Perplexity