O M5 Max é mais rápido que o M3 Ultra em muitos benchmarks de MLX (prefill 2x, decodificação para MoEs, apesar de ter uma largura de banda de memória inferior). Como eu disse, a Apple faz o melhor hardware de consumo do planeta. O futuro da IA parece cada vez mais híbrido entre edge + cloud.