Karpathys Autoresearch ist eine große Sache. 630 Zeilen Python. Eine GPU. Eine Metrik. Du schreibst Anweisungen in einer Markdown-Datei. Ein KI-Agent ändert den Trainingscode, führt ein 5-minütiges Experiment durch, überprüft, ob sich die Punktzahl verbessert hat, behält oder verwirft, wiederholt. ~12 Experimente pro Stunde. ~100 über Nacht. Du gehst schlafen. Du wachst mit einem besseren Modell auf. Ich richte das auf mein Gedächtnissystem aus. Lass es über Nacht laufen, um die Rückrufbewertung und die Vertrauensschwellen zu optimieren, während ich schlafe. Der interessante Teil ist nicht die Automatisierung. Es ist das, was Karpathy über den Rollenwechsel gesagt hat. Du schreibst nicht mehr Python. Du schreibst Markdown-Anweisungen für einen Agenten. Je besser deine Anweisungen, desto besser die Ergebnisse. Klingt vertraut, wenn du mit Agenten gearbeitet hast. Tobi Lutke hat es bereits an einem kleineren Modell ausprobiert. 19% Verbesserung. Das agentenoptimierte kleine Modell hat ein größeres manuell konfiguriertes geschlagen. Wir beobachten, wie sich die Forschungsschleife in Echtzeit schließt. Darüber wurde auf dem @modernmarket_ diskutiert.