Spoločnosť Google načrtla nové metódy na trénovanie robotov pomocou videa a veľkých jazykových modelov

A light, positive scene depicting an animated, small, cute robot assistant against a background of a room lit up by the ethereal glow of a night sky visible through a window. In one claw-like hand, the robot holds a smartphone with a screen displaying lines of code representing neural networks. Around the robot, floating holographic images coming from the smartphone show different tasks it could accomplish. In a corner of the room, a computer screen shows a video with an overlay of a robotic arm in action. The scene is subtly tinged with the warm golden tones of dusk creeping in.

Výskumníci spoločnosti DeepMind Robotics spoločnosti Google skúmajú potenciál generatívnej umelej inteligencie a veľkých základných modelov v robotike. Ich cieľom je poskytnúť robotom lepšie pochopenie ľudských túžob. Roboty boli tradične obmedzené na jednotlivé úlohy, ale novo oznámený systém AutoRT využíva veľké fundamentálne modely na rozšírenie ich schopností. AutoRT využíva vizuálny jazykový model (VLM) na situačné povedomie a riadi flotilu robotov vybavených kamerami. Veľký jazykový model navrhuje úlohy, ktoré môžu roboty vykonať. Systém bol testovaný až s 20 robotmi a 52 rôznymi zariadeniami, pričom zozbieral viac ako 77 000 pokusov. Ďalším vývojovým riešením je RT-Trajectory, ktorý na trénovanie robotov využíva video vstup a prekrýva náčrt ramena v akcii. Táto metóda vykázala dvojnásobnú úspešnosť v porovnaní s predchádzajúcimi tréningovými metódami. RT-Trajectory využíva aj existujúce súbory údajov o robotoch na uvoľnenie znalostí a zlepšenie politík riadenia robotov. Celkovo je cieľom týchto pokrokov umožniť robotom presný a efektívny pohyb v nových situáciách.

Celý článok

Pridaj komentár