Meta Platforms, la empresa matriz de Facebook, Instagram, WhatsApp y Oculus VR, ha lanzado un programa de clonación de voz llamado Audiobox. Audiobox es un programa gratuito que puede replicar el estilo vocal de una persona y generar audio personalizado mediante entradas de voz e indicaciones de texto. Se basa en el modelo autosupervisado Audiobox SSL, que utiliza el aprendizaje autosupervisado para generar sus propias etiquetas para datos no etiquetados. Los investigadores se basaron en 160.000 horas de voz, 20.000 horas de música y 6.000 horas de muestras de sonido para entrenar Audiobox. Meta también ha publicado demostraciones interactivas para mostrar las capacidades de Audiobox, que permiten a los usuarios clonar su propia voz o generar voces nuevas a partir de descripciones de texto. Sin embargo, las demos están restringidas al uso comercial y no están disponibles para los residentes de Illinois o Texas debido a las leyes estatales. Meta tiene previsto invitar a investigadores e instituciones académicas a realizar investigaciones de seguridad y responsabilidad con Audiobox en el futuro. Se espera que pronto surjan versiones comerciales de la tecnología de clonación de voz.
