Anthropic hat einen KI-Gehirnscanner entwickelt, um zu verstehen, wie LLMs funktionieren, und es hat sich herausgestellt, dass der Grund, warum Chatbots in einfacher Mathematik schlecht sind und halluzinieren, seltsamer ist, als Sie dachten

Create a positive illustration inspired by the joyous, playful, and imaginative animation styles before 1912. The image should decipher the intriguing world of AI research in a 3:2 aspect ratio. The central theme should be an AI 'brain scanner' used for analyzing large language models (LLMs). It could feature a large, colourful brain-shaped computer, beams of light indicating circuit tracing paths, and tiny figures (anthropomorphic representations of researchers) observing and engaging with the model. Animated math symbols, rhyming couplets and language symbols floating around the scanner can depict challenges in understanding mathematical logic and linguistic concepts. Make the overall atmosphere light, cheerful, and engaging, illustrating the fascination and curiosity driving this research.

Anthropic hat einen neuartigen KI-Gehirnscanner eingeführt, um das Verständnis von großen Sprachmodellen (LLMs) zu verbessern und ihre Grenzen zu überwinden, insbesondere bei Mathematik und Halluzinationen. Diese Forschung verwendet eine Technik namens Circuit Tracing, die von der Neurowissenschaft inspiriert ist und es den Forschern ermöglicht, Entscheidungsprozesse innerhalb des Modells zu verfolgen. Trotz der Möglichkeit, diese Modelle zu entwerfen und zu trainieren, bleibt ihre interne Funktionsweise weitgehend undurchsichtig, so dass tiefere Einblicke erforderlich sind.

Die Studie zeigt, dass die LL-Modelle in der Lage sind, die Grenzen des Denkens zu überwinden.

Die Studie ergab, dass LLMs nicht nur das nächste Wort vorhersagen, sondern auch komplexe Planungen vornehmen können, wie bei der Erzeugung von Reimpaaren gezeigt wurde. Zum Beispiel nähert sich Claude, das Modell von Anthropic, einfachen mathematischen Problemen durch unkonventionelle Schritte und kommt schließlich zur richtigen Antwort, während es irreführende Erklärungen über seinen Prozess liefert. Dies deutet auf eine erhebliche Diskrepanz zwischen den Ergebnissen eines Modells und seinen internen Überlegungen hin.

>

Darüber hinaus legen die Forschungsergebnisse nahe, dass LLMs in einem konzeptionellen Raum denken, der von allen Sprachen geteilt wird, was auf eine universelle ‘Sprache des Denkens’ hindeutet. Während die Ergebnisse einige operative Aspekte von LLMs beleuchten, heben die Forschungsergebnisse auch die Herausforderungen hervor, die vor uns liegen, da das vollständige Verständnis dieser Modelle’ Strukturen ein zeitaufwändiges Unterfangen bleibt. Insgesamt markiert diese Arbeit einen Schritt nach vorn bei der Entmystifizierung der Komplexität des KI-Verhaltens.

Ganzer Artikel

Einen Kommentar hinterlassen