Stability AI merilis StableVicuna, Chatbot RLHF LLM Open Source Pertama di Dunia

Stability AI telah merilis StableVicuna, chatbot open-source berskala besar pertama yang dilatih melalui pembelajaran yang diperkuat dari umpan balik manusia (RLHF). Keberhasilan model chatting disebabkan oleh dua paradigma pelatihan: penyempurnaan instruksi dan pembelajaran yang diperkuat melalui umpan balik dari manusia. Namun, ada kekurangan akses terbuka dan model sumber terbuka yang menerapkan kedua paradigma tersebut. StableVicuna adalah versi pelatihan yang telah disempurnakan dan dilatih RLHF lebih lanjut dari Vicuna v0 13b, yang merupakan model LLaMA 13b yang telah disempurnakan. Untuk mencapai kinerja yang kuat dari StableVicuna, model dasar Vicuna dilatih lebih lanjut dengan finetuning yang diawasi menggunakan campuran dari tiga set data. Model ini dapat diunduh sebagai delta bobot terhadap model LLaMA asli. Bersamaan dengan chatbot, Stability AI dengan senang hati mempratinjau antarmuka obrolan yang akan datang, yang sedang dalam tahap akhir pengembangan. Perusahaan mendorong pengguna untuk mencoba StableVicuna dan memberikan umpan balik untuk membantu meningkatkan pengalaman pengguna. Model StableVicuna tersedia di ruang HuggingFace. Perusahaan berkomitmen untuk melakukan peningkatan berkelanjutan dan akan mengulangi chatbot ini dan menerapkan bot Discord ke server Stable Foundation. Perusahaan mengucapkan terima kasih kepada para kontributor sumber terbuka yang telah memainkan peran penting dalam mewujudkan proyek ini.

artikel lengkap

Tinggalkan Balasan