Bard ve ChatGPT gibi yapay zeka (AI) sohbet robotları insan benzeri metinler üretebiliyor, ancak araştırmacılar bu modellerin ne söylediklerini gerçekten anlayıp anlamadıklarını sorguluyor. Emily Bender’in bir makalesi, chatbotlarda kullanılan büyük dil modellerinin (LLM’ler) anlama atıfta bulunmadan metin ürettiğini ve bunun da onları “stokastik papağanlar ” haline getirdiğini öne sürüyor; ancak Sanjeev Arora ve Anirudh Goyal tarafından yapılan yeni araştırma, LLM’lerin büyüdükçe ve daha fazla veri üzerinde eğitildikçe, eğitim verilerinde var olması muhtemel olmayan kombinasyonları anlamaya işaret eden yeni yetenekler geliştirdiklerini öne sürüyor. Bu teorik yaklaşım Geoff Hinton gibi uzmanları ikna etmiştir. Arora ve Goyal, LLM davranışını modellemek için rastgele grafik teorisini kullandı ve daha büyük modellerin daha yetenekli hale geldiğini ve birden fazla beceriyi birleştirerek beklenmedik yetenekler kazandığını buldu. Bu modellerin daha önce gördüklerini basitçe taklit etmediklerini savunuyorlar. İddialarını test ederken, LLM’lerin birden fazla beceri kullanarak metin üretebildiğini buldular.
