Stability AI veröffentlicht StableVicuna, den ersten Open Source RLHF LLM Chatbot der AI-Welt

Stability AI hat StableVicuna veröffentlicht, den ersten groß angelegten Open-Source-Chatbot, der mittels verstärktem Lernen durch menschliches Feedback (RLHF) trainiert wurde. Der Erfolg von Chatmodellen ist auf zwei Trainingsparadigmen zurückzuführen: Feinabstimmung von Anweisungen und verstärktes Lernen durch menschliches Feedback. Es gibt jedoch einen Mangel an frei zugänglichen und quelloffenen Modellen, die beide Paradigmen angewandt haben. StableVicuna ist eine weitere auf Instruktionen abgestimmte und mit RLHF trainierte Version von Vicuna v0 13b, einem auf Instruktionen abgestimmten LLaMA 13b-Modell. Um StableVicuna’s starke Leistung zu erreichen, wird das Vicuna-Basismodell mit überwachtem Finetuning unter Verwendung einer Mischung aus drei Datensätzen weiter trainiert. Das Modell kann als Gewichtsdelta gegenüber dem ursprünglichen LLaMA-Modell heruntergeladen werden. Neben dem Chatbot freut sich Stability AI, eine Vorschau auf die kommende Chat-Schnittstelle zu geben, die sich in der Endphase der Entwicklung befindet. Das Unternehmen ermutigt die Nutzer, StableVicuna auszuprobieren und Feedback zu geben, um die Nutzererfahrung zu verbessern. Das StableVicuna-Modell ist auf einem HuggingFace-Platz verfügbar. Das Unternehmen hat sich der kontinuierlichen Verbesserung verschrieben und wird diesen Chatbot weiterentwickeln und einen Discord-Bot auf dem Stable Foundation-Server bereitstellen. Das Unternehmen bedankt sich bei seinen Open-Source-Mitwirkenden, die eine entscheidende Rolle bei der Verwirklichung dieses Projekts gespielt haben.

Ganzer Artikel

Einen Kommentar hinterlassen