扩展推理不仅仅是加速,更关乎架构。 基于 CDNA 4 构建的 AMD Instinct MI350X GPU,使 @digitalocean 的 Agentic Inference Cloud 实现更高的令牌吞吐量和更低的延迟。为生产 AI 设计的性能和效率。