المواضيع الرائجة
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
هل يمكن للروبوتات إتقان التلاعب المعقد من خلال التدرب على فيديوهاتها التي تولدها الذكاء الاصطناعي؟
يقدم باحثون من ستانفورد وتسينغهوا إطار عمل جديد ل VLAW، وهو إطار جديد يهدف إلى تعزيز تعلم الروبوتات من خلال حلقة تغذية راجعة مستمرة.
تستخدم الطريقة استراتيجية تحسين مشترك: حيث تستخدم بيانات الروبوت الحقيقية لجعل محاكي الفيديو أكثر واقعية، والذي يولد بعد ذلك بيانات تدريب صناعي عالية الجودة لتدريب دماغ الروبوت. هذا يحل المشكلة الشائعة حيث تفشل المحاكيات في التقاط التفاصيل الفيزيائية الصغيرة والحاسمة اللازمة للمهام الصعبة.
في التجارب الواقعية، حققت VLAW تحسنا مطلقا بنسبة نجاح بنسبة 39.2٪ مقارنة بالسياسة الأساسية، متفوقة بشكل كبير على النماذج القياسية من خلال سد الفجوة بين المحاكاة والواقع.
VLAW: التحسين المشترك التكراري لسياسة الرؤية واللغة والعمل والنموذج العالمي
الورقة:
الرمز:
تقريرنا:

الأفضل
المُتصدِّرة
التطبيقات المفضلة
