Enfin mis la main sur le gros. Qwen3.5-122B-A10B — 122 milliards de paramètres. Trop gros pour n'importe quel GPU de consommateur. Alors j'en ai loué 4 de chacun... et ensuite une carte professionnelle pour voir si la force brute a même de l'importance. - 1x RTX PRO 6000 (96 Go) : 101,4 tok/s - 4x 5090 (128 Go) : 87,0 tok/s - 4x 4090 (96 Go) : 25,1 tok/s - 4x 3090 (96 Go) : 20,8 tok/s Une seule carte à 8 500 $ a battu quatre RTX 5090.