¡Autoinvestigación para la eficiencia de las muestras! Aproveché la autoinvestigación de @karpathy y cambié el objetivo a minimizar la pérdida de validación para un presupuesto fijo de tokens de 10 millones de tokens. Lo ejecuté durante la noche y el sistema descubrió ajustes que llevaron a una mejora del 14% respecto a la línea base. ¡Qué locura!
Qué funcionó y qué no.
69