Yeni Teori Chatbotların Metinleri Anlayabildiğini Gösteriyor

Generate an image in a positive and light style that conveys the theme of the article titled: 'New Theory Suggests Chatbots Can Understand Text'. Show a vibrant scene of an abstract virtual environment, hinting at the inner workings of artificial intelligence. The scene should be filled with representative elements like gears and binary codes, subtly morphing and shifting as they process vast amount of information. Include the visualization of an AI chatbot, embodied as a friendly, bright, and engaging figure, learning and adapting within this environment. It is interacting with bubbles of text, with some showing unexpected combinations of words, to depict the ability of processing multiple skills. Keep the aspect ratio at 3:2.

Bard ve ChatGPT gibi yapay zeka (AI) sohbet robotları insan benzeri metinler üretebiliyor, ancak araştırmacılar bu modellerin ne söylediklerini gerçekten anlayıp anlamadıklarını sorguluyor. Emily Bender’in bir makalesi, chatbotlarda kullanılan büyük dil modellerinin (LLM’ler) anlama atıfta bulunmadan metin ürettiğini ve bunun da onları “stokastik papağanlar ” haline getirdiğini öne sürüyor; ancak Sanjeev Arora ve Anirudh Goyal tarafından yapılan yeni araştırma, LLM’lerin büyüdükçe ve daha fazla veri üzerinde eğitildikçe, eğitim verilerinde var olması muhtemel olmayan kombinasyonları anlamaya işaret eden yeni yetenekler geliştirdiklerini öne sürüyor. Bu teorik yaklaşım Geoff Hinton gibi uzmanları ikna etmiştir. Arora ve Goyal, LLM davranışını modellemek için rastgele grafik teorisini kullandı ve daha büyük modellerin daha yetenekli hale geldiğini ve birden fazla beceriyi birleştirerek beklenmedik yetenekler kazandığını buldu. Bu modellerin daha önce gördüklerini basitçe taklit etmediklerini savunuyorlar. İddialarını test ederken, LLM’lerin birden fazla beceri kullanarak metin üretebildiğini buldular.

Makalenin tamamı

Bir yanıt yazın