ChatGPT teraz vidí, počuje a hovorí

OpenAI predstavuje nové hlasové a obrazové funkcie v aplikácii ChatGPT, ktoré používateľom umožňujú viesť hlasové konverzácie a zobrazovať AI obrázky. Tieto funkcie ponúkajú intuitívnejšie spôsoby interakcie s ChatGPT v rôznych scenároch, ako je napríklad diskusia o pamiatkach, plánovanie jedál alebo pomoc s matematickými problémami. Hlasové konverzácie je možné začať voľbou funkcie v nastaveniach mobilnej aplikácie a výberom preferovaného hlasu z piatich možností. Hlasová funkcia je podporovaná modelom prevodu textu na reč a profesionálnymi hlasovými hercami. Používatelia môžu tiež zobrazovať obrázky ChatGPT a pomocou nástroja na kreslenie sa zamerať na konkrétne časti. Porozumenie obrázkom umožňujú multimodálne modely GPT. Spoločnosť OpenAI zavádza tieto schopnosti postupne, aby zabezpečila bezpečnosť a zdokonalila zmiernenie rizík. Hlasová technológia má potenciálne kreatívne a prístupové aplikácie, ale nesie so sebou aj riziká, preto sa používa špeciálne pre hlasový chat. Modely založené na zraku sú navrhnuté tak, aby používateľom pomáhali v každodennom živote, a boli založené na spolupráci s organizáciami, ako je Be My Eyes. OpenAI transparentne informuje o obmedzeniach modelov a neodporúča určité prípady použitia. K hlasovým a obrazovým funkciám budú mať najskôr prístup používatelia kategórie Plus a Enterprise, pričom v budúcnosti sa plánuje rozšíriť prístup aj na ďalšie skupiny používateľov.

Celý článok

Pridaj komentár