Інференція масштабування — це про архітектуру, а не лише про прискорення. Відеокарти AMD Instinct MI350X, побудовані на CDNA 4, забезпечують вищу пропускну здатність токенів і нижчу затримку на хмарі агентного виведення @digitalocean. Продуктивність і ефективність, розроблені для виробничого ШІ.