Elon Musk & # 39; s xAI telah memperkenalkan model Grok 1.5 Vision AI, versi yang disempurnakan dari model Grok 1.5 dengan tambahan kemampuan visi komputer. Hal ini memungkinkan model tersebut untuk memproses gambar dan menjawab pertanyaan tentang gambar tersebut. Pengumuman ini disampaikan melalui akun resmi xAI, yang membagikan skor benchmark dan detail tentang model baru ini. Grok 1.5 Vision telah diuji pada berbagai tolok ukur, mengungguli GPT-4 OpenAI dengan Vision di RealWorldQA, tetapi mendapat skor lebih rendah di MMMU dan ChartQA. Visi komputer melengkapi model AI untuk mengidentifikasi dan memahami objek di dunia nyata menggunakan gambar dan video, mirip dengan pemrosesan visual manusia. Teknologi ini memiliki aplikasi yang luas, mulai dari pelacakan kalori dan umpan balik nutrisi hingga potensi penggunaan dalam diagnosis penyakit dan mobil swakemudi. Munculnya model AI multimodal telah meningkatkan fokus pada model yang berfokus pada visi oleh berbagai perusahaan, seperti Google & # 39; Gemini 1.5 Pro dan OpenAI & # 39; GPT-4 dengan Visi.
