El gran modelo de lenguaje (LLM) Claude 3 Opus de Anthropic ha superado por primera vez al GPT-4 de OpenAI en Chatbot Arena, lo que supone un hito en el ámbito de los modelos de lenguaje de IA. La victoria de Claude 3 sobre GPT-4 ha acaparado la atención en las redes sociales, donde el desarrollador de software Nick Dobos ha tuiteado “RIP GPT-4.” Chatbot Arena, gestionada por Large Model Systems Organization (LMSYS ORG), es una plataforma en la que los usuarios puntúan los resultados de dos LLM sin etiquetar, lo que ayuda a calcular los “mejores” modelos en conjunto y a poblar la tabla de clasificación. Esto es crucial para los investigadores que tienen dificultades para medir el rendimiento de los chatbots de IA debido a sus resultados variables. El auge de Claude 3 ha llevado a algunos usuarios a sustituir a ChatGPT en su flujo de trabajo diario, lo que podría afectar a la cuota de mercado de ChatGPT. Además, Gemini Advanced de Google está ganando terreno en el ámbito de los asistentes de IA, lo que supone una competencia para OpenAI. A pesar de ello, OpenAI se está preparando para lanzar un nuevo e importante sucesor de GPT-4 Turbo, posiblemente llamado GPT-4.5 o GPT-5, lo que indica que el espacio de los modelos de lenguaje de IA seguirá estando lleno de competencia y de interesantes sacudidas en la tabla de clasificación de Chatbot Arena en el futuro.
Asistente de lenguaje de Google.
