متجر التطبيق اللامركزي | مركز Web3 للأحداث والألعاب

المواضيع الرائجة

هل يمكن للروبوتات إتقان التلاعب المعقد من خلال التدرب على فيديوهاتها التي تولدها الذكاء الاصطناعي؟ يقدم باحثون من ستانفورد وتسينغهوا إطار عمل جديد ل VLAW، وهو إطار جديد يهدف إلى تعزيز تعلم الروبوتات من خلال حلقة تغذية راجعة مستمرة. تستخدم الطريقة استراتيجية تحسين مشترك: حيث تستخدم بيانات الروبوت الحقيقية لجعل محاكي الفيديو أكثر واقعية، والذي يولد بعد ذلك بيانات تدريب صناعي عالية الجودة لتدريب دماغ الروبوت. هذا يحل المشكلة الشائعة حيث تفشل المحاكيات في التقاط التفاصيل الفيزيائية الصغيرة والحاسمة اللازمة للمهام الصعبة. في التجارب الواقعية، حققت VLAW تحسنا مطلقا بنسبة نجاح بنسبة 39.2٪ مقارنة بالسياسة الأساسية، متفوقة بشكل كبير على النماذج القياسية من خلال سد الفجوة بين المحاكاة والواقع. VLAW: التحسين المشترك التكراري لسياسة الرؤية واللغة والعمل والنموذج العالمي الورقة: الرمز: تقريرنا:

الأفضل

المُتصدِّرة

التطبيقات المفضلة