DApp Store | Hub Web3 pentru evenimente și jocuri

Subiecte populare

Pot roboții să stăpânească manipularea complexă exersând în propriile videoclipuri generate de AI? Cercetători de la Stanford și Tsinghua introduc VLAW, un nou cadru conceput pentru a stimula învățarea roboților printr-un circuit continuu de feedback. Metoda folosește o strategie de co-îmbunătățire: datele reale ale roboților sunt folosite pentru a face un simulator video mai realist, care apoi generează date sintetice de înaltă calitate pentru antrenarea creierului robotului. Aceasta rezolvă problema comună în care simulatoarele nu reușesc să surprindă detaliile fizice mici și critice necesare pentru sarcini dificile. În experimentele din lumea reală, VLAW a obținut o îmbunătățire a ratei absolute de succes de 39,2% față de politica de bază, depășind semnificativ modelele standard prin reducerea efectivă a distanței dintre simulare și realitate. VLAW: Co-îmbunătățire iterativă a politicii viziune-limbaj-acțiunii și modelului mondial Hârtie: Cod: Raportul nostru:

Limită superioară

Clasament

Favorite