Elon Musk’s xAI ha presentado el modelo Grok 1.5 Vision AI, una versión mejorada del modelo Grok 1.5 con capacidades añadidas de visión por ordenador. Esto permite al modelo procesar imágenes y responder a preguntas sobre ellas. El anuncio se ha realizado a través de la cuenta oficial de xAI’, en la que se han compartido las puntuaciones de los benchmarks y los detalles del nuevo modelo. El Grok 1.5 Vision se probó en varios benchmarks, superando al GPT-4 de OpenAI’s con Vision en RealWorldQA, pero con una puntuación inferior en MMMU y ChartQA. La visión por ordenador permite a los modelos de IA identificar y comprender objetos del mundo real a partir de imágenes y vídeos, de forma similar al procesamiento visual humano. Esta tecnología tiene aplicaciones muy diversas, desde el seguimiento de calorías y la información nutricional hasta su uso potencial en el diagnóstico de enfermedades y la conducción autónoma de automóviles. El auge de los modelos de IA multimodal ha llevado a varias empresas a centrarse cada vez más en modelos centrados en la visión, como Gemini 1.5 Pro de Google y GPT-4 with Vision de OpenAI.
