Los chatbots de inteligencia artificial (IA) como Bard y ChatGPT son capaces de producir textos similares a los humanos, pero los investigadores se preguntan si estos modelos entienden realmente lo que dicen. Un artículo de Emily Bender sugiere que los grandes modelos lingüísticos (LLM) utilizados en los chatbots generan texto sin referencia al significado, lo que los convierte en “loros estocásticos” Sin embargo, una nueva investigación de Sanjeev Arora y Anirudh Goyal propone que a medida que los LLM crecen y se entrenan con más datos, desarrollan nuevas capacidades que apuntan a la comprensión de combinaciones que probablemente no existan en los datos de entrenamiento. Este planteamiento teórico ha convencido a expertos como Geoff Hinton. Arora y Goyal utilizaron la teoría de grafos aleatorios para modelizar el comportamiento de los LLM y descubrieron que los modelos más grandes se vuelven más hábiles y adquieren capacidades inesperadas al combinar múltiples habilidades. Argumentan que estos modelos no se limitan a imitar lo que han visto antes. Como prueba de su afirmación, descubrieron que los LLM pueden generar texto utilizando múltiples habilidades.
