Dokument predstavuje Voyager, agenta celoživotného vzdelávania v Minecrafte, ktorý neustále skúma svet, získava rôzne zručnosti a robí nové objavy bez ľudského zásahu. Voyager pozostáva z troch kľúčových komponentov: automatického učebného programu, ktorý maximalizuje prieskum, neustále rastúcej knižnice zručností spustiteľného kódu na ukladanie a načítavanie komplexného správania a nového iteratívneho podnetového mechanizmu, ktorý zahŕňa spätnú väzbu z prostredia, chyby pri vykonávaní a samoverifikáciu na zlepšenie programu. Voyager komunikuje s GPT-4 prostredníctvom dotazov na čiernu skrinku, čím sa obchádza potreba jemného dolaďovania parametrov modelu. Empiricky Voyager vykazuje silnú schopnosť celoživotného učenia v kontexte a vykazuje výnimočnú zručnosť pri hraní Minecraftu. Získava 3,3× viac unikátnych predmetov, prekonáva 2,3× väčšie vzdialenosti a odomyká kľúčové míľniky technologického stromu až 15,3× rýchlejšie ako predchádzajúci SOTA. Voyager dokáže využiť naučenú knižnicu zručností v novom svete Minecraft na riešenie nových úloh od začiatku, zatiaľ čo iné techniky majú problém so zovšeobecnením. Dokument sa zaoberá aj výzvami pri budovaní všeobecne schopných stelesnených agentov, ktorí neustále skúmajú, plánujú a rozvíjajú nové zručnosti v otvorených svetoch. Autori tvrdia, že klasické prístupy využívajú učenie posilňovaním (RL) a učenie napodobňovaním, ktoré fungujú na primitívnych akciách, čo by mohlo byť náročné na systematické skúmanie, interpretovateľnosť a zovšeobecňovanie. Najnovšie pokroky v oblasti agentov založených na veľkých jazykových modeloch (LLM) využívajú znalosti o svete zapuzdrené v predtrénovaných LLM na generovanie konzistentných akčných plánov alebo vykonateľných politík. Aplikujú sa na stelesnené úlohy, ako sú hry a robotika, ako aj na úlohy NLP bez stelesnenia. V závere dokumentu sa uvádza, že Voyager slúži ako východiskový bod na vývoj výkonných generalistických agentov bez ladenia parametrov modelu.
