Open source klonovanie hlasu s umelou inteligenciou prichádza s novým modelom OpenVoice spoločnosti MyShell

An illustration for a tech article about an open-source voice cloning solution called OpenVoice. The image captures a futuristic scene with a robot assistant standing by a computer screen displaying OpenVoice's interface. The robot is playfully mimicking different voices - changing its tone, emotion, accent, rhythm, pauses, and intonation. You can see a variety of waveforms and audio metrics on the screen. In the background, symbols of academic institutions and an AI-startup are visible, suggesting collaborative research. Farther in the background, there is an abstract representation of various speakers, whose voices are being cloned. The color palette is bright and optimistic, with the overall atmosphere being positive and cutting edge.

Výskumníci z MIT, Tsinghua University a kanadský startup MyShell vyvinul open-source riešenie na klonovanie hlasu s názvom OpenVoice. Na rozdiel od iných platforiem ponúka OpenVoice granulárne ovládanie a takmer okamžité klonovanie hlasu. Používatelia môžu precízne klonovať hlasy, ovládať tón, emócie, prízvuk, rytmus, pauzy a intonáciu pomocou malého zvukového klipu. Vývojári poskytli vopred recenzovanú výskumnú prácu a odkazy na prístup a vyskúšanie OpenVoice. Cieľom MyShell je podporovať výskumnú komunitu open-source poskytovaním grantov, súborov údajov a výpočtového výkonu. Spoločnosť verí, že hlas je kľúčovou modalitou pre umelú všeobecnú inteligenciu (AGI) a rozhodla sa zamerať na klonovanie hlasu s otvoreným zdrojovým kódom. OpenVoice pozostáva z modelu prevodu textu na reč a konvertora tónov, ktoré sú vyškolené na zvukových vzorkách od rôznych hovoriacich. MyShell, decentralizovaná platforma, ponúka OpenVoice spolu s ďalšími znakmi, botmi a funkciami AI, pričom si účtuje mesačné predplatné a za dáta na trénovanie AI.

Celý článok

Pridaj komentár