终于拿到了大货。 Qwen3.5-122B-A10B — 1220亿参数。对于任何单一消费者GPU来说都太大了。 所以我租了4个每种……然后再加一张专业卡,看看蛮力是否真的重要。 - 1x RTX PRO 6000 (96GB): 101.4 tok/s - 4x 5090 (128GB): 87.0 tok/s - 4x 4090 (96GB): 25.1 tok/s - 4x 3090 (96GB): 20.8 tok/s 一张价值$8,500的卡打败了四张RTX 5090。