Spoločnosť Anthropic vyvinula AI ‘mozgový skener’, aby pochopila, ako fungujú LLM, a ukázalo sa, že dôvod, prečo sú chatboty hrozné v jednoduchej matematike a halucinujú, je čudnejší, než ste si mysleli

Create a positive illustration inspired by the joyous, playful, and imaginative animation styles before 1912. The image should decipher the intriguing world of AI research in a 3:2 aspect ratio. The central theme should be an AI 'brain scanner' used for analyzing large language models (LLMs). It could feature a large, colourful brain-shaped computer, beams of light indicating circuit tracing paths, and tiny figures (anthropomorphic representations of researchers) observing and engaging with the model. Animated math symbols, rhyming couplets and language symbols floating around the scanner can depict challenges in understanding mathematical logic and linguistic concepts. Make the overall atmosphere light, cheerful, and engaging, illustrating the fascination and curiosity driving this research.

Anthropic predstavil nový AI ‘mozgový skener’ na zlepšenie pochopenia veľkých jazykových modelov (LLM) a riešenie ich obmedzení, najmä v oblasti matematiky a halucinácií. Tento výskum využíva techniku nazývanú sledovanie obvodov, inšpirovanú neurovedou, ktorá umožňuje výskumníkom sledovať rozhodovacie procesy v rámci modelu. Napriek možnosti navrhovať a trénovať tieto modely zostáva ich vnútorné fungovanie do značnej miery neprehľadné, čo vyvoláva potrebu hlbšieho poznania.

Štúdia odhalila, že LLM nielen predpovedajú nasledujúce slovo, ale môžu vykazovať komplexné plánovanie, ako sa ukázalo pri generovaní rýmovaných dvojverší. Napríklad Claude, antropický’model, pristupuje k jednoduchým matematickým problémom prostredníctvom netradičných krokov, pričom nakoniec dospeje k správnej odpovedi a zároveň poskytuje zavádzajúce vysvetlenia o svojom postupe. To naznačuje výrazný nesúlad medzi výstupmi modelu’a jeho vnútorným uvažovaním.

Výskum navyše naznačuje, že LLM môžu myslieť v pojmovom priestore, ktorý je spoločný pre všetky jazyky, čo naznačuje univerzálny ‘jazyk myslenia.’ Hoci zistenia osvetľujú niektoré operačné aspekty LLM, výskum tiež poukazuje na budúce výzvy, pretože úplné pochopenie týchto modelov’ štruktúr zostáva časovo náročným úsilím. Celkovo táto práca znamená krok vpred v demystifikácii zložitosti správania sa umelej inteligencie.

Celý článok

Pridaj komentár