A autopesquisa da Karpathy é algo importante. 630 linhas de Python. uma GPU. Uma métrica. Você escreve instruções em um arquivo markdown. um agente de IA modifica o código de treinamento, executa um experimento de 5 minutos, verifica se a pontuação melhorou, mantém ou descarta, repete. ~12 experimentos por hora. ~100 durante a noite. Você vai dormir. Você acorda com um modelo melhor. Estou apontando isso para meu sistema de memória. Deixo rodar durante a noite, otimizando a pontuação de recordação e os limiares de confiança enquanto durmo. A parte interessante não é a automação. É o que Karpathy disse sobre a mudança de papéis. Você não está mais escrevendo em Python. Você está escrevendo instruções de desconto para um agente. Quanto melhores suas instruções, melhores os resultados. Parece familiar se você tem construído com agentes. Tobi Lutke já o usava em um modelo menor. Melhora de 19%. O modelo pequeno otimizado para agentes superava um modelo maior configurado manualmente. Estamos assistindo ao ciclo de pesquisa se fechar em tempo real. Conversei sobre isso na @modernmarket_