Autoresearch voor Monster Efficiëntie! Ik heb @karpathy's autoresearch genomen en het doel veranderd naar het minimaliseren van de validatieverlies voor een vast tokenbudget van 10M tokens. Ik heb het 's nachts laten draaien en het systeem ontdekte aanpassingen die leidden tot een verbetering van 14% ten opzichte van de basislijn. Zo gek!
Wat werkte en wat werkte niet.
84