Subiecte populare
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Pot roboții să stăpânească manipularea complexă exersând în propriile videoclipuri generate de AI?
Cercetători de la Stanford și Tsinghua introduc VLAW, un nou cadru conceput pentru a stimula învățarea roboților printr-un circuit continuu de feedback.
Metoda folosește o strategie de co-îmbunătățire: datele reale ale roboților sunt folosite pentru a face un simulator video mai realist, care apoi generează date sintetice de înaltă calitate pentru antrenarea creierului robotului. Aceasta rezolvă problema comună în care simulatoarele nu reușesc să surprindă detaliile fizice mici și critice necesare pentru sarcini dificile.
În experimentele din lumea reală, VLAW a obținut o îmbunătățire a ratei absolute de succes de 39,2% față de politica de bază, depășind semnificativ modelele standard prin reducerea efectivă a distanței dintre simulare și realitate.
VLAW: Co-îmbunătățire iterativă a politicii viziune-limbaj-acțiunii și modelului mondial
Hârtie:
Cod:
Raportul nostru:

Limită superioară
Clasament
Favorite
