Autoresearch för proveffektivitet! Jag tog @karpathy autoresearch och ändrade målet till att minimera valideringsförlust för en fast tokenbudget på 10 miljoner tokens. Körde det över natten och systemet upptäckte justeringar som ledde till 14 % förbättring jämfört med baslinjen. Så galet!
Vad som fungerade och vad som inte gjorde det.
139