Наконец-то я заполучил большой экземпляр. Qwen3.5-122B-A10B — 122 миллиарда параметров. Слишком большой для любого отдельного потребительского GPU. Поэтому я арендовал по 4 штуки каждого... и затем одну профессиональную карту, чтобы проверить, имеет ли значение грубая сила. - 1x RTX PRO 6000 (96GB): 101.4 ток/с - 4x 5090 (128GB): 87.0 ток/с - 4x 4090 (96GB): 25.1 ток/с - 4x 3090 (96GB): 20.8 ток/с Одна единственная карта за $8,500 обошла четыре RTX 5090.