Spoločnosť xAI Elona Muska predstavila model Grok 1.5 Vision AI, vylepšenú verziu modelu Grok 1.5 s pridanými schopnosťami počítačového videnia. To modelu umožňuje spracovávať obrázky a odpovedať na otázky o nich. Oznámenie bolo zverejnené prostredníctvom oficiálneho účtu xAI’s zdieľaním výsledkov benchmarkov a podrobností o novom modeli. Model Grok 1.5 Vision bol testovaný v rôznych benchmarkoch, pričom v RealWorldQA prekonal OpenAI’GPT-4 s Vision, ale v MMMU a ChartQA dosiahol nižšie skóre. Počítačové videnie vybavuje modely umelej inteligencie na identifikáciu a pochopenie objektov v reálnom svete pomocou obrázkov a videí, podobne ako pri ľudskom vizuálnom spracovaní. Táto technológia má široké využitie, od sledovania kalórií a spätnej väzby o výžive až po potenciálne využitie pri diagnostike chorôb a samojazdiacich autách. Nárast multimodálnych modelov umelej inteligencie viedol k zvýšenému zameraniu sa rôznych firiem na modely zamerané na videnie, ako napríklad Google’s Gemini 1.5 Pro a OpenAI’s GPT-4 with Vision.
