Anthropic telah mengembangkan AI ‘pemindai otak & #8217; untuk memahami cara kerja LLM dan ternyata alasan mengapa chatbot sangat buruk dalam matematika sederhana dan berhalusinasi lebih aneh dari yang Anda kira

Create a positive illustration inspired by the joyous, playful, and imaginative animation styles before 1912. The image should decipher the intriguing world of AI research in a 3:2 aspect ratio. The central theme should be an AI 'brain scanner' used for analyzing large language models (LLMs). It could feature a large, colourful brain-shaped computer, beams of light indicating circuit tracing paths, and tiny figures (anthropomorphic representations of researchers) observing and engaging with the model. Animated math symbols, rhyming couplets and language symbols floating around the scanner can depict challenges in understanding mathematical logic and linguistic concepts. Make the overall atmosphere light, cheerful, and engaging, illustrating the fascination and curiosity driving this research.

Anthropic telah memperkenalkan AI ‘pemindai otak ’ baru untuk meningkatkan pemahaman tentang model bahasa besar (LLM) dan mengatasi keterbatasannya, terutama dalam matematika dan halusinasi. Penelitian ini menggunakan teknik yang disebut penelusuran sirkuit, yang terinspirasi oleh ilmu saraf, yang memungkinkan para peneliti untuk melacak proses pengambilan keputusan di dalam model. Terlepas dari kemampuan untuk merancang dan melatih model-model ini, cara kerja internal mereka sebagian besar masih buram, sehingga mendorong kebutuhan akan wawasan yang lebih dalam.

Penelitian ini mengungkapkan bahwa LLM tidak hanya memprediksi kata berikutnya, tetapi juga dapat menunjukkan perencanaan yang rumit, seperti yang ditunjukkan saat menghasilkan bait-bait berima. Sebagai contoh, model Claude, model Anthropic, mendekati masalah matematika sederhana melalui langkah-langkah yang tidak konvensional, yang pada akhirnya sampai pada jawaban yang benar sambil memberikan penjelasan yang menyesatkan tentang prosesnya. Hal ini mengindikasikan adanya keterputusan yang signifikan antara keluaran model dan penalaran internalnya.

Selain itu, penelitian ini menunjukkan bahwa LLM mungkin berpikir dalam ruang konseptual yang digunakan bersama dalam berbagai bahasa, yang mengisyaratkan adanya ‘bahasa pemikiran universal.’ Meskipun temuan ini menjelaskan beberapa aspek operasional LLM, penelitian ini juga menyoroti tantangan di masa mendatang, karena memahami sepenuhnya model ’model ’ struktur ini tetap menjadi upaya yang memakan waktu. Secara keseluruhan, penelitian ini menandai sebuah langkah maju dalam mengungkap kompleksitas perilaku AI.

Artikel lengkap

Tinggalkan Balasan