Språkmodeller
📄 Språkmodeller
Section titled “📄 Språkmodeller”🎯 Lärandemål
- Förstå hur språkmodeller fungerar
- Veta skillnaden mellan traditionell programmering och språkmodeller (se förra avsnittet för grunden)
- Förstå vad ett kontextfönster är och varför det är viktigt
- Känna till de viktigaste begränsningarna
I förra avsnittet pratade vi om generativ AI – nu zoomar vi in på den mest omtalade typen: språkmodeller (t.ex. ChatGPT, Claude, Gemini). Hur fungerar de – och vad behöver du veta för att använda dem effektivt?
Vad är en språkmodell?
Enkelt sagt: en språkmodell är tränad på enormt mycket text. Den förutsäger vilket ord som troligen kommer härnäst, baserat på alla ord som kommit innan – mönster den lärt sig från träningsdata.
När du skriver “Vad är huvudstaden i” lutar modellen åt att nästa ord är ett landsnamn, följt av ett svarsformat med en stad.
Moderna modeller kan svara på komplexa frågor, skriva kod, sammanfatta, översätta och resonera – men de genererar fortfarande text utifrån sannolikhet och mönster, inte mänsklig “förståelse” i ordets fulla bemärkelse.
Hur tränas en språkmodell?
-
Datainsamling – Enorma textmängder från böcker, artiklar, webb, Wikipedia, forum m.m.
-
Träning – Modellen lär sig mönster via neurala nätverk: vilka ord som följer varandra, hur meningar är uppbyggda, hur olika texttyper skiljer sig. Kräver massiv beräkning; miljontals parametrar justeras.
-
Finjustering – Människor bedömer svar så modellen blir mer hjälpsam, relevant, korrekt och säker.
Resultat: en modell som kan generera flytande text om nästan vilket ämne som helst – inom ramen för sin träning och sitt kunskapsläge.
Vad är ett kontextfönster?
Kontextfönstret är den totala mängd text modellen kan arbeta med i ett svep – som korttidsminne.
Allt måste rymmas där: din fråga, tidigare meddelanden, bifogad text och modellens egna svar. Det mäts ofta i tokens (små textbitar – ord, stavelser eller tecken).
Varför spelar det roll?
- Långa dokument – En hel bok får sällan plats; du måste dela upp eller använda verktyg som RAG.
- Långa chattar – När fönstret är fullt tappar modellen de äldsta delarna (i Intric kan du få fel om kontexten är full).
- Samband – Mer relevant kontext i rätt ordning ger oftast bättre svar.
RAG – hur man ger modellen aktuell och omfattande kunskap
RAG (Retrieval-Augmented Generation) låter modellen slippa klämma in hela en jättekunskapsbas i en prompt varje gång.
Istället:
- Dokument delas i mindre stycken (chunks) med metadata (dokument, sida, avsnitt).
- När du frågar plockar systemet de stycken som verkar mest relevanta.
- Bara de bitarna skickas in i kontextfönstret tillsammans med din fråga.
Det är som en bibliotekarie som hämtar rätt kapitel åt dig i stället för att lägga hela hyllan på bordet.
Begränsningar för språkmodeller
-
Kunskapsdatum – Träningen slutar vid ett datum; händelser efter det finns inte i “grundmodellen” (kopplingar till webben är ett separat lager).
-
Hallucinationer – Modellen kan låta övertygande men fel – särskilt när den fyller luckor utan tillräckliga källor.
-
Ingen verklig förståelse – Stark på textmönster; svag på sådant som kräver verklig erfarenhet, känsel och gemensam världsbild.
-
Kontextbegränsning – Du är låst till kontextfönstrets storlek och hur väl rätt information faktiskt kommer med.
-
Inkonsistens – Samma fråga kan ge något olika svar (sampling, temperatur, små skillnader i formulering).
Sammanfattning
Section titled “Sammanfattning”- Språkmodeller förutsätter nästa ord utifrån mönster i träningsdata.
- Kontextfönstret begränsar hur mycket som kan ingå åt gången.
- RAG hämtar relevanta utdrag så du slipper fylla hela dokument i prompten.
- Viktiga risker: kunskapsdatum, hallucinationer, bristande “verklig” förståelse och variation i svar.
Testa dina kunskaper
3 frågor · 100 % rätt för att godkännas · Granska svar när du är klar