Oxford-forskere kører AI på en pc fra 1998 med 128 MB RAM

AI på en Pentium II: nostalgisk pc får nyt liv

Et hold fra Oxford satte et sprogmodel i gang på en computer, der stammer fra Windows 98's æra og opkaldsforbindelsernes tid. Forsøget viser, at kunstig intelligens ikke nødvendigvis kræver et dyrt grafikkort eller et datacenter – med klog software og kun 128 MB RAM kommer man overraskende langt.

Eksperimentet blev udført af EXO Labs, en organisation grundlagt af forskere fra Universitetet i Oxford. De brugte en konfiguration, som de fleste gamere i 2026 ville grine ad: en Intel Pentium II på 350 MHz med 128 MB arbejdshukommelse, kørende på et gammelt styresystem.

I stedet for et moderne GPU eller et kraftfuldt multicore-system satte forskerne deres fulde lid til optimering. De valgte et ekstremt letvægts sprogmodel baseret på den minimalistiske LLama2.c-kode – en stærkt trimmet variant af de velkendte LLaMA-modeller, specielt tilpasset til at bruge så lidt hukommelse og regnekraft som muligt.

En pc, der kunne have streamet VM-finalen i 1998, genererer i 2026 faktisk AI-tekster med blot 128 MB RAM.

Det anvendte model tæller kun omkring 260.000 parametre. Til sammenligning opererer moderne modeller ubesværet med titusinder eller hundredvis af milliarder parametre. Alligevel formåede dette lille model at generere tekst med en hastighed på cirka 39,3 tokens i sekundet – bemærkelsesværdigt hurtigt på så gammel hardware.

For at illustrere begrænsningerne: hvis modellen blev skaleret op til en milliard parametre på den samme hardware, ville hastigheden falde til cirka 0,0093 token i sekundet. På det tidspunkt venter man mange minutter på blot få ord, og praktisk brug bliver umulig.

Absurd lille historie, teknisk imponerende resultat

Modellens output er ingen litterær klassiker. I demonstrationen producerede pc'en en noget kaotisk fortælling med mærkelige drejninger og gentagelser. Sætningerne er ikke altid grammatisk fejlfrie, men der opstår alligevel en slags genkendelig struktur med dialoger, karakterer og handling.

For moderne AI-brugere, der er vant til GPT-4-lignende kvalitet, ser det måske en smule klumsete ud. Ikke desto mindre viser det, at selv kraftigt begrænsede modeller på årtier gammel hardware kan producere en form for naturligt sprog. I mange sammenhænge er "godt nok" vigtigere end "perfekt".

Sætningerne følger hinanden logisk nok til at kunne læses.
Maskinen reagerer hurtigt på simple spørgsmål.
Al behandling foregår lokalt – helt uden internetforbindelse.
Hardwaren bruger en brøkdel af den energi, moderne servere forbruger.

Netop den kombination – lave krav, lave omkostninger og fuldstændig offlinedrift – gør dette eksperiment interessant langt ud over den nostalgiske faktor.

Hvorfor dette er vigtigere end en sjov geek-stunt

EXO Labs præsenterer ikke forsøget som et trick for retrofans, men som en erklæring om, hvordan AI-industrien fungerer i dag. Mens virksomheder som Nvidia opkræver titusinder af dollars for high-end chips som Blackwell B200, viser Oxford, at der findes en helt anden tilgang: software der gør maksimalt ud af minimale ressourcer.

Forskerne ønsker frem for alt at demonstrere, at AI kan blive mindre eksklusivt. Hvis modellerne selv gøres slanke nok, behøver brugerne ikke have adgang til store cloudplatforme eller datacentre. Simpel hardware kan være tilstrækkelig – især til opgaver, der ikke kræver gigantiske modeller.

Færre parametre, klogere kode og mere effektive modeller kan gøre AI tilgængeligt for folk med et lille budget – og for enheder, der i dag stadig betragtes som "dumme".

Vejen mod billig og energibesparende AI

Eksperimentet berører en voksende diskussion om kunstig intelligens' fremtid. Den nuværende tendens er: større, dyrere og mere energikrævende. Samtidig vokser kritikken af datacentrenes strømforbrug og afhængigheden af en håndfuld store chip- og cloudleverandører.

Projekter som EXO Labs' skitserer en alternativ vej, hvor fokus ligger på optimering frem for rå kraft. Det kan opnås på flere måder:

Teknik	Formål
Modelkomprimering	Fjerne unødvendige parametre for at gøre modellen mindre.
Kvantisering	Gemme tal i modellen med færre bits for at spare hukommelse.
Effektive algoritmer	Organisere beregninger klogere, så processoren skal gøre mindre arbejde.
Lokal inferens	Køre AI-opgaver direkte på enheden uden ekstern server.

Hvert af disse tiltag reducerer hardwarekravene. For velhavende lande betyder det færre dyre opgraderinger og lavere strømforbrug. For fattigere regioner åbner det døren til AI-anvendelser på eksisterende infrastruktur.

Hvad sådanne lette modeller kan – og ikke kan

En kompakt model med 260.000 parametre vil aldrig erstatte en fuldt fungerende chatbot, der besvarer komplekse juridiske eller medicinske spørgsmål. Kvaliteten og nuancen er ganske enkelt ikke god nok til det. Men der er utallige scenarier, hvor en sådan letvægts-AI sagtens kan gøre nytte.

Eksempler på praktiske anvendelser

Automatiske tekstforslag i simpel kontorsoftware eller mailprogrammer på ældre pc'er.
Lokal stemmestyring til husholdningsapparater, biler eller industrielle maskiner.
Uddannelsessoftware på billige bærbare i lande, hvor moderne hardware er utilgængelig.
Simple chatassistenter på enheder uden stabil internetforbindelse.
Privatlivsfølsomme anvendelser, hvor data aldrig forlader den lokale maskine.

Netop i miljøer, hvor strømforsyningen er upålidelig eller mobilinternet forbliver dyrt, kan sådanne løsninger gøre en reel forskel. Et let AI-model på en simpel computer kan der have større indvirkning end en perfekt GPT-4-variant, der kun fungerer via en hurtig skyforbindelse.

Hvorfor 128 MB RAM stadig kan være relevant

For den gennemsnitlige dansker med en moderne laptop lyder 128 MB RAM som en dårlig joke. De fleste smartphones har i dag mindst 4 GB – ofte mere. Alligevel kører der globalt stadig millioner af enheder med ekstremt begrænsede ressourcer: gamle skoler-pc'er, industrielle terminaler, medicinsk udstyr, kasseapparater, routere og billige indlejrede systemer.

Hvis AI-modeller fortsat kan tilpasses til sådan hardware, opstår der et stort marked for "stille" fornyelse: eksisterende udstyr får nye funktioner, uden at alt skal udskiftes. Det sparer penge – men også elektronisk affald.

Derudover tvinger det forskere til at tænke kreativt. Når hukommelsesgrænsen er så lav, bliver hver eneste byte vigtig. Sådanne begrænsninger har historisk set ofte affødt overraskende smarte løsninger – fra kompressionsalgoritmer til kompakte styresystemer. Den tankegang ser nu ud til at vende tilbage inden for AI-verdenen.

Hvad dette betyder for almindelige brugere

For den gennemsnitlige pc-bruger ændrer der sig ikke noget i morgen: til store, generelle AI-modeller er man foreløbig stadig afhængig af skyen eller kraftig hardware. Ikke desto mindre kaster dette eksperiment et andet lys over, hvad der egentlig er "nødvendigt" for at gøre noget nyttigt med AI.

Man behøver ikke altid den største model eller det nyeste GPU. Til mange daglige opgaver – generere en kort tekst, opsummere en menu, køre en simpel chatbot – kan en mindre, mere effektiv model sagtens slå til. Udviklere, der fokuserer på det, kan bygge apps, der også fungerer på ældre bærbare, budgettelefoner og billige mini-pc'er.

For dem, der undrer sig over, om AI vil dukke op overalt i de kommende år, er denne Pentium II-demonstration et klart signal om, at det teknisk set er muligt. Ikke ved at opstille gigantiske servere overalt, men ved at trimme softwaren så meget, at selv en pc fra 1998 stadig kan være med.