Mở rộng suy diễn không chỉ là về tăng tốc mà còn là về kiến trúc. GPU AMD Instinct MI350X, được xây dựng trên CDNA 4, cho phép thông lượng token cao hơn và độ trễ thấp hơn trên Đám mây Suy diễn Agentic của @digitalocean. Hiệu suất và hiệu quả, được thiết kế cho AI sản xuất.