Finalmente consegui colocar as mãos no grande. Qwen3.5-122B-A10B — 122 bilhões de parâmetros. Grande demais para qualquer GPU de consumidor único. Então aluguei 4 de cada... E depois uma carta profissional para ver se a força bruta realmente importa. - 1x RTX PRO 6000 (96GB): 101,4 tok/s - 4x 5090 (128GB): 87,0 tok/s - 4x 4090 (96GB): 25,1 tok/s - 4x 3090 (96GB): 20,8 tok/s Uma única placa de $8.500 superava quatro RTX 5090