Anthropic, LLM’lerin nasıl çalıştığını anlamak için bir yapay zeka ‘beyin tarayıcısı’ geliştirdi ve sohbet robotlarının basit matematikte berbat olmasının ve halüsinasyon görmesinin nedeninin düşündüğünüzden daha garip olduğu ortaya çıktı

Create a positive illustration inspired by the joyous, playful, and imaginative animation styles before 1912. The image should decipher the intriguing world of AI research in a 3:2 aspect ratio. The central theme should be an AI 'brain scanner' used for analyzing large language models (LLMs). It could feature a large, colourful brain-shaped computer, beams of light indicating circuit tracing paths, and tiny figures (anthropomorphic representations of researchers) observing and engaging with the model. Animated math symbols, rhyming couplets and language symbols floating around the scanner can depict challenges in understanding mathematical logic and linguistic concepts. Make the overall atmosphere light, cheerful, and engaging, illustrating the fascination and curiosity driving this research.

Anthropic, büyük dil modellerinin (LLM’ler) anlaşılmasını geliştirmek ve özellikle matematik ve halüsinasyondaki sınırlamalarını ele almak için yeni bir yapay zeka ‘beyin tarayıcısı’ tanıttı. Bu araştırma, araştırmacıların model içindeki karar verme süreçlerini izlemelerine olanak tanıyan ve sinirbilimden esinlenen devre izleme adı verilen bir teknik kullanmaktadır. Bu modelleri tasarlama ve eğitme yeteneğine rağmen, iç işleyişleri büyük ölçüde opak kalmakta ve daha derin içgörülere ihtiyaç duyulmaktadır.

Çalışma, LLM’lerin yalnızca bir sonraki kelimeyi tahmin etmediğini, kafiyeli beyitler oluştururken gösterildiği gibi karmaşık planlama sergileyebildiğini ortaya koydu. Örneğin, Anthropic’in modeli Claude, basit matematik problemlerine alışılmadık adımlarla yaklaşır, sonuçta doğru cevaba ulaşırken süreci hakkında yanıltıcı açıklamalar sunar. Bu, bir modelin çıktıları ile iç muhakemesi arasında önemli bir kopukluk olduğunu gösterir.

Ayrıca araştırma, LLM’lerin diller arasında paylaşılan kavramsal bir alanda düşünebileceğini ve evrensel bir ‘düşünce diline işaret edebileceğini öne sürüyor.’ Bulgular LLM’lerin bazı operasyonel yönlerini aydınlatırken, araştırma aynı zamanda bu modellerin ’ yapılarını tam olarak anlamak zaman alıcı bir çaba olmaya devam ettiği için önümüzdeki zorlukları da vurguluyor. Genel olarak, bu çalışma yapay zeka davranışının karmaşıklığının aydınlatılmasında ileriye doğru atılmış bir adımdır.

Makalenin tamamı

Bir yanıt yazın