Škálování inference je o architektuře, ne jen o akceleraci. GPU AMD Instinct MI350X, postavené na CDNA 4, umožňují vyšší propustnost tokenů a nižší latenci v Agentic Inference Cloud od @digitalocean. Výkon a efektivita, navržené pro produkční AI.