Výskumníci z MIT, Tsinghua University a kanadský startup MyShell vyvinul open-source riešenie na klonovanie hlasu s názvom OpenVoice. Na rozdiel od iných platforiem ponúka OpenVoice granulárne ovládanie a takmer okamžité klonovanie hlasu. Používatelia môžu precízne klonovať hlasy, ovládať tón, emócie, prízvuk, rytmus, pauzy a intonáciu pomocou malého zvukového klipu. Vývojári poskytli vopred recenzovanú výskumnú prácu a odkazy na prístup a vyskúšanie OpenVoice. Cieľom MyShell je podporovať výskumnú komunitu open-source poskytovaním grantov, súborov údajov a výpočtového výkonu. Spoločnosť verí, že hlas je kľúčovou modalitou pre umelú všeobecnú inteligenciu (AGI) a rozhodla sa zamerať na klonovanie hlasu s otvoreným zdrojovým kódom. OpenVoice pozostáva z modelu prevodu textu na reč a konvertora tónov, ktoré sú vyškolené na zvukových vzorkách od rôznych hovoriacich. MyShell, decentralizovaná platforma, ponúka OpenVoice spolu s ďalšími znakmi, botmi a funkciami AI, pričom si účtuje mesačné predplatné a za dáta na trénovanie AI.
