Anthropic predstavil nový AI ‘mozgový skener’ na zlepšenie pochopenia veľkých jazykových modelov (LLM) a riešenie ich obmedzení, najmä v oblasti matematiky a halucinácií. Tento výskum využíva techniku nazývanú sledovanie obvodov, inšpirovanú neurovedou, ktorá umožňuje výskumníkom sledovať rozhodovacie procesy v rámci modelu. Napriek možnosti navrhovať a trénovať tieto modely zostáva ich vnútorné fungovanie do značnej miery neprehľadné, čo vyvoláva potrebu hlbšieho poznania.
Štúdia odhalila, že LLM nielen predpovedajú nasledujúce slovo, ale môžu vykazovať komplexné plánovanie, ako sa ukázalo pri generovaní rýmovaných dvojverší. Napríklad Claude, antropický’model, pristupuje k jednoduchým matematickým problémom prostredníctvom netradičných krokov, pričom nakoniec dospeje k správnej odpovedi a zároveň poskytuje zavádzajúce vysvetlenia o svojom postupe. To naznačuje výrazný nesúlad medzi výstupmi modelu’a jeho vnútorným uvažovaním.
Výskum navyše naznačuje, že LLM môžu myslieť v pojmovom priestore, ktorý je spoločný pre všetky jazyky, čo naznačuje univerzálny ‘jazyk myslenia.’ Hoci zistenia osvetľujú niektoré operačné aspekty LLM, výskum tiež poukazuje na budúce výzvy, pretože úplné pochopenie týchto modelov’ štruktúr zostáva časovo náročným úsilím. Celkovo táto práca znamená krok vpred v demystifikácii zložitosti správania sa umelej inteligencie.
