Model bahasa besar (LLM) Claude 3 Opus milik Antropic telah melampaui GPT-4 milik OpenAI di Chatbot Arena untuk pertama kalinya, menandai momen penting dalam bidang model bahasa AI. Kemenangan Claude 3 atas GPT-4 telah menarik perhatian di media sosial, dengan pengembang perangkat lunak Nick Dobos men-tweet “RIP GPT-4.” Chatbot Arena, yang dijalankan oleh Large Model Systems Organization (LMSYS ORG), adalah sebuah platform di mana pengguna menilai output dari dua LLM yang tidak berlabel, membantu menghitung “terbaik ” model secara agregat dan mengisi papan peringkat. Hal ini sangat penting bagi para peneliti yang kesulitan mengukur performa chatbot AI karena hasil yang berbeda-beda. Munculnya Claude 3 telah menyebabkan beberapa pengguna mengganti ChatGPT dalam alur kerja harian mereka, yang berpotensi berdampak pada pangsa pasar ChatGPT. Selain itu, Gemini Advanced dari Google mendapatkan daya tarik di ruang asisten AI, sehingga menimbulkan persaingan bagi OpenAI. Meskipun demikian, OpenAI sedang bersiap untuk merilis penerus utama baru untuk GPT-4 Turbo, kemungkinan bernama GPT-4.5 atau GPT-5, yang mengindikasikan bahwa ruang model bahasa AI akan terus penuh dengan persaingan dan perombakan yang menarik di papan peringkat Chatbot Arena di masa depan.
