Meta menguji coba proyek Purple Llama bagi pengembang AI untuk menguji risiko keamanan dalam model

Meta telah meluncurkan sebuah proyek bernama Purple Llama, yang bertujuan untuk menyediakan perangkat sumber terbuka bagi para pengembang untuk menilai dan meningkatkan kepercayaan dan keamanan dalam model AI generatif mereka. Proyek ini melibatkan kolaborasi dengan pengembang aplikasi AI lainnya, platform cloud, perancang chip, dan bisnis perangkat lunak. Paket pertama yang dirilis di bawah Purple Llama mencakup alat untuk menguji masalah keamanan siber dalam model penghasil perangkat lunak dan model bahasa yang mengklasifikasikan teks yang tidak pantas atau mengandung kekerasan. Pengujian awal menunjukkan bahwa model bahasa yang besar menunjukkan kode yang rentan 30 persen dari waktu. Alat CyberSec Eval memungkinkan pengembang untuk menjalankan tes tolok ukur untuk memeriksa keamanan model AI mereka. Llama Guard adalah model bahasa yang dilatih untuk mengklasifikasikan teks dan mengidentifikasi konten yang eksplisit secara seksual, menyinggung, berbahaya, atau melanggar hukum. Pengembang dapat menguji model mereka dengan menjalankan perintah input dan respons output yang dihasilkan oleh Llama Guard. Purple Llama mengambil pendekatan dua cabang untuk keamanan dan keselamatan, dengan fokus pada input dan output AI. Proyek ini bertujuan untuk menciptakan pusat massa untuk kepercayaan dan keamanan terbuka dalam pengembangan AI.

Artikel lengkap

Tinggalkan Balasan