Esta es la razón por la que necesitamos benchmarks abiertos para la IA local. De lo contrario, se convierte en tribalismo y en insultos. Publicaremos la base de datos más grande de benchmarks abiertos para la IA local, probada en más de 1,000 configuraciones de hardware reales. Cada dispositivo, cada interconexión, diferentes modelos/cuantizaciones. Tenemos una oficina llena de hardware: cada Mac con M-chip, cada iPhone, cada RTX, DGX Spark, Strix Halo, Pi, … En general, el silicio de Apple tiene una economía de unidades de memoria superior y las GPU tienen una economía de unidades de cómputo superior. Lo que es mejor depende de la carga de trabajo y la concurrencia. La verdad (que será evidente en los benchmarks abiertos) es que lo mejor es alguna combinación de los dos: pon tus cosas que consumen mucha memoria en los Macs, y las que requieren cómputo en las GPU.