la autoresearch de karpathy es algo grande. 630 líneas de python. una GPU. una métrica. tu escribes instrucciones en un archivo markdown. un agente de IA modifica el código de entrenamiento, ejecuta un experimento de 5 minutos, verifica si la puntuación mejoró, lo mantiene o lo descarta, y repite. ~12 experimentos por hora. ~100 durante la noche. tu te vas a dormir. te despiertas con un mejor modelo. estoy apuntando esto a mi sistema de memoria. déjalo correr toda la noche optimizando la puntuación de recuerdo y los umbrales de confianza mientras duermo. la parte interesante no es la automatización. es lo que karpathy dijo sobre el cambio de rol. ya no estás escribiendo python. estás escribiendo instrucciones en markdown para un agente. cuanto mejores sean tus instrucciones, mejores serán los resultados. suena familiar si has estado construyendo con agentes. tobi lutke ya lo ejecutó en un modelo más pequeño. 19% de mejora. el modelo pequeño optimizado por el agente superó a uno más grande configurado manualmente. estamos viendo el ciclo de investigación cerrarse en tiempo real. lo discutimos en el @modernmarket_