Voyager: Agen Berwujud Terbuka dengan Model Bahasa Besar

Dokumen ini memperkenalkan Voyager, sebuah agen pembelajaran seumur hidup di Minecraft yang terus menjelajahi dunia, memperoleh beragam keterampilan, dan membuat penemuan baru tanpa campur tangan manusia. Voyager terdiri dari tiga komponen utama: kurikulum otomatis yang memaksimalkan eksplorasi, pustaka keterampilan yang terus berkembang dari kode yang dapat dieksekusi untuk menyimpan dan mengambil perilaku yang kompleks, dan mekanisme permintaan berulang yang menggabungkan umpan balik lingkungan, kesalahan eksekusi, dan verifikasi mandiri untuk peningkatan program. Voyager berinteraksi dengan GPT-4 melalui kueri blackbox, yang melewati kebutuhan untuk menyempurnakan parameter model. Secara empiris, Voyager menunjukkan kemampuan pembelajaran seumur hidup yang kuat dalam konteks dan menunjukkan kemahiran yang luar biasa dalam bermain Minecraft. Ia mendapatkan item unik 3,3x lebih banyak, menempuh jarak 2,3x lebih jauh, dan membuka tonggak-tonggak penting dalam pohon teknologi hingga 15,3x lebih cepat dari SOTA sebelumnya. Voyager dapat memanfaatkan pustaka keterampilan yang dipelajari di dunia Minecraft yang baru untuk menyelesaikan tugas-tugas baru dari awal, sementara teknik-teknik lain sulit untuk digeneralisasi. Dokumen ini juga membahas tantangan dalam membangun agen yang secara umum mampu mewujudkan agen yang terus mengeksplorasi, merencanakan, dan mengembangkan keterampilan baru di dunia yang bersifat terbuka. Para penulis berpendapat bahwa pendekatan klasik menggunakan pembelajaran penguatan (RL) dan pembelajaran imitasi yang beroperasi pada tindakan primitif, yang dapat menjadi tantangan untuk eksplorasi sistematis, interpretabilitas, dan generalisasi. Kemajuan terbaru dalam agen berbasis model bahasa besar (LLM) memanfaatkan pengetahuan dunia yang dienkapsulasi dalam LLM yang telah dilatih sebelumnya untuk menghasilkan rencana tindakan yang konsisten atau kebijakan yang dapat dieksekusi. Mereka diterapkan pada tugas-tugas yang diwujudkan seperti permainan dan robotika, serta tugas-tugas NLP tanpa perwujudan. Dokumen ini menyimpulkan dengan menyatakan bahwa Voyager berfungsi sebagai titik awal untuk mengembangkan agen generalis yang kuat tanpa menyetel parameter model.

Dokumen tersebut menyimpulkan bahwa Voyager berfungsi sebagai titik awal untuk mengembangkan agen generalis yang kuat tanpa menyetel parameter model.

artikel lengkap

Tinggalkan Balasan