Dokumen ini memperkenalkan BLOOMChat 176B, sebuah LLM berbasis obrolan multibahasa. Model ini dikembangkan dengan menggabungkan data percakapan sintetis dan contoh-contoh tulisan manusia berkualitas tinggi, dan kemudian dilatih dengan dataset buatan manusia Dolly 2.0 dan OASST1. Kemampuan chatting multibahasa dan kemampuan tugas lintas bahasa dari model ini dievaluasi melalui pengukuran kualitatif dan kuantitatif. BLOOMChat mencapai hasil yang menjanjikan dalam kedua percobaan, melampaui varian BLOOM lainnya dan model chatting open-source yang canggih dalam tugas penerjemahan. Model ini memiliki keterbatasan, seperti halusinasi dan kinerja yang terbatas dalam menghasilkan kode yang akurat atau memecahkan masalah matematika yang kompleks. Dokumen ini juga mengakui kontribusi dari berbagai peneliti dan proyek sumber terbuka terhadap pengembangan BLOOMChat. Dokumen ini menyediakan tautan ke kumpulan data yang digunakan dalam eksperimen dan mengundang komunitas untuk mendiskusikan BLOOMChat atau mengobrol dengan tim.
