Meta ensaya el proyecto Purple Llama para que los desarrolladores de IA comprueben los riesgos de seguridad en los modelos

Meta ha lanzado un proyecto llamado Purple Llama, cuyo objetivo es proporcionar herramientas de código abierto para que los desarrolladores evalúen y mejoren la confianza y la seguridad en sus modelos generativos de IA. El proyecto implica la colaboración con otros desarrolladores de aplicaciones de IA, plataformas en la nube, diseñadores de chips y empresas de software. El primer paquete publicado en el marco de Purple Llama incluye herramientas para comprobar cuestiones de ciberseguridad en modelos generadores de software y un modelo lingüístico que clasifica textos inapropiados o violentos. Las pruebas iniciales demostraron que los grandes modelos lingüísticos sugerían código vulnerable el 30% de las veces. La herramienta CyberSec Eval permite a los desarrolladores realizar pruebas comparativas para comprobar la seguridad de sus modelos de IA. Llama Guard es un modelo lingüístico entrenado para clasificar texto e identificar contenido sexualmente explícito, ofensivo, dañino o ilícito. Los desarrolladores pueden probar sus modelos ejecutando preguntas de entrada y respuestas de salida generadas por Llama Guard. Purple Llama adopta un enfoque doble de la seguridad, centrándose tanto en las entradas como en las salidas de la IA. El proyecto pretende crear un centro de masas para la confianza abierta y la seguridad en el desarrollo de la IA.

Artículo completo

Deja una respuesta