a autoresearch do karpathy é uma grande coisa. 630 linhas de python. uma GPU. uma métrica. você escreve instruções em um arquivo markdown. um agente de IA modifica o código de treinamento, executa um experimento de 5 minutos, verifica se a pontuação melhorou, mantém ou descarta, repete. ~12 experimentos por hora. ~100 durante a noite. você vai dormir. você acorda com um modelo melhor. estou apontando isso para o meu sistema de memória. deixe-o rodar durante a noite otimizando a pontuação de recuperação e os limiares de confiança enquanto eu durmo. a parte interessante não é a automação. é o que karpathy disse sobre a mudança de papel. você não está mais escrevendo python. você está escrevendo instruções em markdown para um agente. quanto melhores suas instruções, melhores os resultados. soa familiar se você tem trabalhado com agentes. otobi lutke já executou isso em um modelo menor. 19% de melhoria. o modelo pequeno otimizado pelo agente superou um maior configurado manualmente. estamos assistindo o ciclo de pesquisa se fechar em tempo real. discutimos isso no @modernmarket_