Forskere afslører: AI lærer som os – uden spild

Mens techgiganterne fortsætter med at stable større modeller og datacentre oven på hinanden, præsenterer neuroforskere nu en helt anderledes tilgang.

I stedet for at forbruge endnu flere chips og endnu mere data stiller forskerne spørgsmålet: hvorfor ikke bare lære af den menneskelige hjerne? Et amerikansk team mener at have fundet nøglen. Deres nye metode til at træne neurale netværk kobler læring direkte til en slags “arbejdshukommelse”. Færre beregningsskridt, mindre energi og en adfærd, der forbløffende meget ligner menneskelig læring.

Hvordan nuværende AI-modeller spilder energi

Kraften bag store sprogmodeller og billedgeneratorer har en bagside: de sluger strøm. Under træningsfasen passerer milliarder af eksempler gennem gigantiske netværk. Hvert lag udfører sin beregning, sender det hele videre til det næste, og først helt til sidst bliver netværket opdateret.

Denne fremgangsmåde har to store ulemper. For det første flytter systemet konstant enorme mængder data mellem hukommelse og beregningsenheder. For det andet skal modellen ofte gennemløbe hele kæden, før en eneste justering af en forbindelse, en synapse, sker.

Den klassiske træningsmetode til neurale netværk tvinger data gennem en lang pipeline, hvilket gør hver læringsjustering dyr, langsom og energikrævende.

Forskere fra Cold Spring Harbor Laboratory i USA hævder, at her ligger det største spild: ikke kun i selve beregningerne, men især i informationens logistik.

Hvad hjernen gør anderledes

Vores hjerne tackler dette problem på en helt anden måde. Mennesker lærer ikke ved at gentage den samme situation millioner af gange. En enkelt oplevelse kan sommetider efterlade et varigt indtryk. Det sker takket være et subtilt samspil mellem arbejdshukommelse og synaptiske ændringer.

Arbejdshukommelsen holder midlertidigt information fast: et telefonnummer, en sætning i en tekst, positionen af en genstand vi lige så. Mens vi fastholder denne information, kan forbindelserne mellem neuroner justere sig. Læring og hukommelse bliver således direkte koblet sammen.

I hjernen virker arbejdshukommelsen ikke kun som en kladdeblok, men også som en styringsmekanisme, der bestemmer, hvilke forbindelser skal ændres, og hvilke der kan forblive uberørte.

Denne idé fra neurovidenskaben har indtil nu været svær at oversætte til kunstige netværk. De fleste AI-arkitekturer behandler hukommelse som noget separat: en buffer, et kontekstvindue eller en ekstern lagring.

Et kunstigt netværk med arbejdshukommelse

Teamet fra Cold Spring Harbor har nu designet en tilgang, hvor hver kunstig neuron modtager feedback via et ekstra hukommelseslignende netværk. Denne hukommelse kører ikke bare ved siden af netværket, men arbejder igennem det.

Synapser der justerer sig i realtid

I den nye arkitektur behøver information ikke længere at gennemløbe en komplet kæde af lag, før modellen lærer noget. Hvert lag får adgang til en slags intern arbejdshukommelse, der sender de nødvendige signaler tilbage. Sådan kan en synapse justere sig næsten øjeblikkeligt, så snart relevant information er tilgængelig.

Datastrømmen behøver ikke altid at nå det sidste lag.
Hver neuron kan få feedback via hukommelsesvejen.
Synapser tilpasser sig allerede ved mellemtrin.
Det reducerer antallet af beregninger pr. læringsskridt.

Denne tilgang minder om en krydsning mellem klassisk deep learning og en mere biologisk inspireret læringsmetode, som hebbisk læring, hvor synapser bliver stærkere, når to neuroner er aktive sammen.

En ny støtte til en gammel teori

Forskerne kobler deres model til en endnu ikke fuldt bevist idé fra neurovidenskaben: at arbejdshukommelse direkte påvirker læringsrytmen og endda skolepræstationer. I det nye netværk giver arbejdshukommelsen ikke kun information videre, men styrer også hvilke forbindelser skal ændres.

Ved at koble arbejdshukommelse direkte til synaptiske opdateringer opstår en mekanisme, der både accelererer læring og reducerer energiforbrug.

Hvis denne tilgang beviser sig i praktiske anvendelser, kan det grundlæggende ændre den måde, AI-modeller designes på: fra rå kraft til finmaskede, kontekststyrede opdateringer.

Mindre regnekraft, mindre udledning

AI’s energibehov vokser eksplosivt. Nogle eksperter advarer om, at datacentre snart vil konkurrere med hele landes netkapacitet. Hver teknik, der opnår samme præstationer med mindre beregningstid, tæller derfor dobbelt: for omkostningerne og for klimaet.

En model, der takket være arbejdshukommelse behøver færre eksempler, forbruger færre GPU-timer. Færre GPU-timer betyder mindre elektrisk energi, mindre køling og dermed også mindre indirekte CO₂-udledning.

Kendetegn	Klassisk netværk	Netværk med arbejdshukommelse
Placering af feedback	Primært i slutningen af netværket	På flere lag via hukommelsessti
Dataflytning	Meget frem og tilbage gennem alle lag	Kortere ruter, flere lokale opdateringer
Antal eksempler nødvendige for at lære	Meget stort	Potentielt betydeligt mindre
Energi pr. træningsrunde	Høj	Lavere, afhængig af implementering

For virksomheder, der nu bruger millioner på cloudtræning, kan dette på længere sigt blive et økonomisk argument. For regeringer spiller et andet element ind: AI-systemer, der kræver mindre energi, passer bedre ind i klima- og infrastrukturplaner.

Hvad betyder dette for næste generation af AI?

Teknologien befinder sig stadig i en forskningsfase, men retningen er klar. Fremtidige AI-systemer vil måske ligne kognitive modeller fra psykologien mere end rene matematiske funktioner.

Et netværk, der under en opgave holder information kortvarigt fast, kan forstå kontekst bedre. Det gælder for tekst, men også for robotter, der skal handle i et fysisk uforudsigeligt miljø, som plejerobotter eller logistiksystemer.

Fra datamonstrene til effektive elever

Mange nuværende modeller kræver milliarder af parametre for at give pålidelige resultater. De lærer langsomt, men generaliserer rimeligt godt, når de først er trænet. En arbejdshukommelsesstyret tilgang åbner døren til mindre netværk, der tilpasser sig hurtigere.

En AI kunne for eksempel efter få eksempler allerede kunne tage fat på en ny opgave i stedet for at have behov for en komplet gentræning. Det kommer tættere på menneskelig “few-shot”-læring: at tilegne sig en færdighed ud fra en håndfuld eksempler eller forklaringsøjeblikke.

Hvis synapser i AI-netværk kan justere sig i et menneskeligt tempo, skifter fokus fra at indsamle data til effektivt at lære af færre eksempler.

Nye risici og muligheder

En mere menneskelignende læringsstil medfører også nye spørgsmål. Et system, der lærer hurtigere af få eksempler, kan blive mere følsomt over for fordomme i input. Et enkelt skævt datasæt eller en række fejlagtige instruktioner kan allerede få en mærkbar indflydelse på adfærden.

Derfor bliver kvaliteten af træningsdata endnu mere kritisk. Kurering, diversitet og kontrol bliver lige så vigtige som regnekraft og modelarkitektur.

Tilgangen åbner dog interessante muligheder:

Personlige AI-assistenter, der virkelig tilpasser sig brugeren uden dataindsamling i massiv skala.
Industrielle anvendelser, der lærer lokalt i fabrikken uden konstant kontakt til skyen.
Undervisningssoftware, der lærer i én elevs tempo og justerer sig fleksibelt.

Et skridt mod kognitiv AI

Under motorhjelmen henviser denne forskning til et koncept, der ofte dukker op i informationsteori: den såkaldte “information bottleneck”. Denne tilgang tvinger et system til kun at fastholde den mest relevante information og smide støj væk. I kombination med en hebbisk læringsregel får hvert signal, der passerer gennem arbejdshukommelsen, ekstra vægt ved justering af synapser.

Det ligner den måde, mennesker fokuserer på: vi filtrerer det, der ikke tæller, mens vi netop forstærker afgørende detaljer. En AI med sådan en mekanisme ville ikke bare beregne mere effektivt, men kunne også blive mere robust over for overflødige data og små forstyrrelser.

For udviklere og forskere udgør dette en interessant legeplads. Simuleringer kan for eksempel vise, hvordan et lille netværk med arbejdshukommelse klarer sig mod et traditionelt, meget større netværk. Tænk på opgaver som simpel matematik, kortsigtet planlægning eller interaktioner i et robotmiljø. Hver test giver mere indsigt i spørgsmålet: hvor meget menneskelignende arkitektur er nødvendig for virkelig at lære anderledes, end de nuværende modeller gør?