أصدرت NVIDIA نموذج Nemotron 3 Super، وهو نموذج تفكير أوزان مفتوحة بسعة 120B (نشط 12B) يحصل على تقييم 36 في مؤشر الذكاء التحليلي الاصطناعي، مع بنية هجينة بين مامبا-محول MoE حصلنا على الوصول إلى هذا النموذج قبل الإطلاق وقيموه من حيث الذكاء والانفتاح وكفاءة الاستدلال. النقاط الرئيسية ➤ يجمع بين الانفتاح العالي والذكاء القوي: أداء Nemotron 3 Super بقوة بالنسبة لحجمه وهو أكثر ذكاء بكثير من أي نموذج آخر ذو انفتاح مماثل ➤ حصل Nemotron 3 Super على 36 نقطة في مؤشر الذكاء التحليلي الاصطناعي، متقدما +17 نقطة على الإصدار السابق Super و+12 نقطة عن Nemotron 3 Nano. مقارنة بالنماذج ذات الفئة المشابهة من الحجم، هذا يضعه في المقدمة على GPT-OSS-120B (33)، لكنه خلف Qwen3.5 122B A10B الذي تم إصداره مؤخرا (42). ➤ التركيز على الذكاء الفعال: وجدنا أن Nemotron 3 Super يتمتع بذكاء أعلى من gpt-oss-120b مع تمكين ~10٪ زيادة في معدل نقل لكل وحدة معالجة رسومية في اختبار تحميل بسيط لكنه واقعي ➤ مدعوم اليوم للاستدلال السريع بدون خادم: مزودون مثل @DeepInfra و@LightningAI يخدمون هذا النموذج عند الإطلاق بسرعات تصل إلى 484 رمزا في الثانية تفاصيل النموذج 📝 يحتوي Nemotron 3 Super على 120.6 مليار معلمة بإجمالي و12.7 مليار معلمة نشطة، بالإضافة إلى نافذة سياق بقيمة مليون رمز ودعم للتفكير الهجين. ينشر بأوزان مفتوحة ورخصة متساهلة، إلى جانب بيانات التدريب المفتوحة والإفصاح عن المنهجية 📐 يحتوي النموذج على عدة ميزات تصميم تتيح الاستدلال الفعال، بما في ذلك استخدام هياكل هجينة بين مامبا-ترانسفورمر وLatentMoE، والتنبؤ بعدة رموز، وأوزان كمية NVFP4 🎯 NVIDIA دربت Nemotron 3 Super مسبقا بدقة NVFP4 (في الغالب)، لكنها انتقلت إلى BF16 بعد التدريب. تستخدم درجات التقييم لدينا أوزان BF16 🧠 قمنا بمقارنة نيموترون 3 سوبر في وضع الاستدلال الأعلى جهدا ("العادي"), وهو الأكثر قدرة من بين أوضاع الاستدلالات الثلاثة في النموذج (الاستدلال، منخفض الجهد، والمنتظم)
أصدرت NVIDIA بيانات مهمة قبل وبعد التدريب إلى جانب وصفات تدريب شاملة جديدة لهذا النموذج. تصل هذه الإفصاحات إلى الدرجة 83 في مؤشر الانفتاح التحليلي الاصطناعي، خلف النماذج عالية الانفتاح فقط من Ai2 وMBZUAI، وتضع Nemotron 3 Super في أكثر الربع جاذبية للانفتاح والذكاء بين النظراء. نيموترون 3 سوبر هو أذكى نموذج تم إصداره على الإطلاق بهذا المستوى من الانفتاح.
استخدم Nemotron 3 Super عددا كبيرا نسبيا من الرموز عبر تقييماتنا. استخدم 110 مليون رمز خرج لإجراء تقييمات مؤشر الذكاء الاصطناعية للتحليل الاصطناعي، وهو أكثر بحوالي 40٪ من gpt-oss-120b مع جهد تفكير عالي، لكنه أقل ~20٪ مقارنة ب Nemotron 3 Nano. وهذا أقل بكثير من الرموز مقارنة ب Claude Opus 4.6 (الحد الأقصى لألبوم) من Anthropic، التي استخدمت 160 مليون رمز، وأقل قليلا من GPT-5.4 (xhigh) من OpenAI، التي استخدمت 120 مليون رمز.
عند 120 مليار مع 12 مليار معلمة نشطة، لا يزال Nemotron 3 Super صغيرا نسبيا مقارنة بنماذج الأوزان المفتوحة الحديثة الأخرى من أكبر المختبرات العالمية — GLM-5 (744 مليار إجمالا، 40 مليار نشط)، Qwen3.5 397B A17B (إجمالي 397 ملايت، 17 مليار نشط)، وكيمي K2.5 (1 طن إجمالي، 32 مليار نشط) كل منها أكبر ب 3 إلى 8 أضعاف.
تركز NVIDIA على الذكاء الفعال لعائلة نيموترون، وقد اختبرنا أداء الاستدلال مقابل نماذج نظيرة لرؤية تأثير اختيارات البنية. أجرينا اختبارات إنتاجية مستضافة ذاتيا عبر مجموعة من نماذج الأقران باستخدام منهجية بسيطة مع أعباء عمل تمثل حالات الاستخدام الشائعة مثل سير العمل الوكيلي مع تاريخ متوسط، تطبيقات RAG، أو معالجة المستندات. في هذا الاختبار، يظهر Nemotron 3 Super (NVFP4) معدل نقل أعلى بنسبة 11٪ لكل وحدة معالجة رسومات NVIDIA B200 مقارنة ب gpt-oss-120b (MXFP4)، مما يضع Nemotron 3 Super 'للأعلى واليمين' مقارنة ب gpt-oss-120b. Qwen3.5 122B A10B يحقق +6 نقاط في مؤشر الذكاء مقارنة ب Nemotron 3 Super، لكنه يحقق معدل نقل أقل بنسبة 40٪ لكل وحدة معالجة رسوميات. تم تقييم درجات مؤشر الذكاء الخاص بنا لنيموترون 3 سوبر بناء على أوزان BF16. لم نقم بعد بتقييم ما إذا كان هناك أي تأثير ذكي لتكميم NVFP4، لكن اختبارات NVIDIA الداخلية وجدت أن نموذج NVFP4 حقق دقة متوسطة بلغت 99.8٪ مقارنة بخط الأساس ل BF16. لمزيد من التفاصيل حول إعداد الاختبار وتكوين النماذج لدينا، راجع مقالنا عن Nemotron 3 Super:
سيكون Nemotron 3 Super متاحا منذ إصداره على واجهات برمجة التطبيقات بدون خادم من مزودين مثل Lightning AI وDeepInfra. اختبرنا هذه النقاط النهائية ونرى أداء يصل إلى 484 رمزا في الثانية على أحمال إدخال الرمز القياسية البالغة 10 آلاف رمز. عند الإطلاق، يقع Nemotron 3 Super في أكثر الربع جاذبية من حيث الذكاء وسرعة الإخراج بين نظيريه المماثلين.
‏‎6.55‏K