Kloning suara AI sumber terbuka hadir dengan model OpenVoice baru dari MyShell

An illustration for a tech article about an open-source voice cloning solution called OpenVoice. The image captures a futuristic scene with a robot assistant standing by a computer screen displaying OpenVoice's interface. The robot is playfully mimicking different voices - changing its tone, emotion, accent, rhythm, pauses, and intonation. You can see a variety of waveforms and audio metrics on the screen. In the background, symbols of academic institutions and an AI-startup are visible, suggesting collaborative research. Farther in the background, there is an abstract representation of various speakers, whose voices are being cloned. The color palette is bright and optimistic, with the overall atmosphere being positive and cutting edge.

Para peneliti di MIT, Universitas Tsinghua, dan startup AI asal Kanada, MyShell, telah mengembangkan solusi kloning suara sumber terbuka yang disebut OpenVoice. Tidak seperti platform lain, OpenVoice menawarkan kontrol granular dan kloning suara yang nyaris seketika. Pengguna dapat mengkloning suara dengan presisi, mengendalikan nada, emosi, aksen, ritme, jeda, dan intonasi menggunakan klip audio kecil. Para pengembang telah menyediakan makalah penelitian yang telah ditinjau sebelumnya dan tautan untuk mengakses dan mencoba OpenVoice. MyShell bertujuan untuk mendukung komunitas penelitian sumber terbuka dengan menyediakan hibah, kumpulan data, dan daya komputasi. Perusahaan ini percaya bahwa suara adalah modalitas penting untuk Artificial General Intelligence (AGI) dan memutuskan untuk fokus pada kloning suara sumber terbuka. OpenVoice terdiri dari model text-to-speech dan konverter nada, yang dilatih dengan sampel audio dari berbagai pembicara. MyShell, sebuah platform terdesentralisasi, menawarkan OpenVoice bersama dengan karakter, bot, dan fitur AI lainnya, dengan biaya langganan bulanan dan untuk data pelatihan AI.

Artikel lengkap

Tinggalkan Balasan