Finalmente conseguí el grande. Qwen3.5-122B-A10B — 122 mil millones de parámetros. Demasiado grande para cualquier GPU de consumidor individual. Así que alquilé 4 de cada uno... y luego una tarjeta profesional para ver si la fuerza bruta realmente importa. - 1x RTX PRO 6000 (96GB): 101.4 tok/s - 4x 5090 (128GB): 87.0 tok/s - 4x 4090 (96GB): 25.1 tok/s - 4x 3090 (96GB): 20.8 tok/s Una sola tarjeta de $8,500 superó a cuatro RTX 5090s