NVIDIA Nemotron 3 Super 🎉の紹介 オープンな120Bパラメータ(12Bアクティブ)ハイブリッドマンバ-トランスフォーマーMoEモデル ネイティブ1Mトークンコンテキスト 計算効率が高く高精度なマルチエージェントアプリケーション向けに構築されています さらに、完全にオープンな重み、データセット、レシピも提供し、カスタマイズや展開が容易です。🧵
この最新のNemotronファミリーの新作は、単なる大きなNanoではありません。 ✅ 前バージョンの最大5倍のスループットと2倍の精度を実現 ✅ 同じ推論コストで4倍の専門家を呼ぶ潜在的MoE(潜在的MoE) ✅ 生成時間を劇的に短縮するマルチトークン予測 ✅ ハイブリッドマンバ-トランスフォーマーバックボーンはメモリと計算効率を4倍に向上させます ✅ NVIDIA Blackwell向けに最適化されたネイティブNVFP4事前学習 モデル👇の背後にあるアーキテクチャの決定とトレーニング方法について深く掘り下げた記事をご覧ください
🦞これらの革新が組み合わさり、長期稼働する自律型エージェントに適したモデルが生まれています。 @OpenClawコーディングエージェントとしてのLLMを評価するベンチマークであるPinchBenchでは、Nemotron 3 Superは全テストスイートで85.6%のスコアを獲得し、同クラスで最も優れたオープンモデルとなっています。
@openclaw 「NVIDIA Nemotron 3 Super:オープンで効率的なインテリジェンスの新たなリーダー」
Artificial Analysis
Artificial Analysis8時間前
NVIDIAは、ハイブリッドなMamba-Transformer MoEアーキテクチャを持つ人工分析知能指数(Artificial Analysis Intelligence Index)で36点を獲得した、120B(12Bアクティブ)のオープンウェイト推論モデルNemotron 3 Superをリリースしました ローンチ前にこのモデルへのアクセス権を与えられ、知能、開放性、推論効率の面で評価しました。 主なポイント 高い開放性と高い知能を兼ね備えている:Nemotron 3 Superはそのサイズに対して優れた性能を示し、同等の開閉度を持つ他のどのモデルよりもはるかに高い知能を持っています † Nemotron 3 SuperはArtificial Analysis Intelligence Indexで36点を獲得し、前回のSuperリリースより+17ポイント、Nemotron 3 Nanoより+12ポイントの差をつけました。同サイズのモデルと比べると、これはGPT-OSS-120B(33)より上位ですが、最近発売されたQwen3.5 122B A10B(42)には及びません。 効率的なインテリジェンスに焦点を当てて:Nemotron 3 SuperはGPT-OSS-120bよりも高い知能を持ち、シンプルながら現実的な負荷テストでGPUあたり約10%のスループット向上を実現しました † 今日は高速なサーバーレス推論に対応しています:@DeepInfraや@LightningAIなどのプロバイダーが、ローンチ時に最大484トークン/秒の速度でこのモデルを提供しています モデルの詳細 📝 Nemotron 3 Superは合計120.6億トークンとアクティブパラメータ1270万倍、さらに100万トークンコンテキストウィンドウとハイブリッド推論サポートを備えています。オープンウェイトと許可ライセンス、オープントレーニングデータおよび方法論の開示とともに公開されています 📐 このモデルには、ハイブリッドなマンバトランスフォーマーおよびLatentMoEアーキテクチャ、マルチトークン予測、NVFP4量子化重みなど、効率的な推論を可能にする複数の設計特徴があります 🎯 NVIDIAはNemotron 3 Superを(主に)NVFP4精度で事前学習しましたが、後処理はBF16に移行しました。評価スコアはBF16の重みを使用しています 🧠 私たちはNemotron 3 Superを、モデルの3つの推論モード(推論オフ、低努力、通常)の中で最も高性能な、最も高い努力推論モード(「通常」)でベンチマークしました
@openclaw ✨ Nemotron 3 Superは、モデルセレクターのドロップダウンから@Perplexity_ai ProおよびMaxの加入者向けに提供されています。また、エージェントAPIやPerplexity Computerを通じても使用できます。
196