autoresearch Karpathy'ego to wielka sprawa. 630 linii Pythona. jedna GPU. jedna metryka. piszesz instrukcje w pliku markdown. agent AI modyfikuje kod treningowy, przeprowadza 5-minutowy eksperyment, sprawdza, czy wynik się poprawił, zachowuje lub odrzuca, powtarza. ~12 eksperymentów na godzinę. ~100 przez noc. zasypiasz. budzisz się z lepszym modelem. skierowałem to na mój system pamięci. niech działa przez noc, optymalizując wyniki przypomnienia i progi pewności, podczas gdy śpię. interesująca część nie dotyczy automatyzacji. chodzi o to, co powiedział Karpathy o zmianie roli. nie piszesz już Pythona. piszesz instrukcje markdown dla agenta. im lepsze twoje instrukcje, tym lepsze wyniki. brzmi znajomo, jeśli budowałeś z agentami. tobi lutke już to uruchomił na mniejszym modelu. 19% poprawy. model mały, zoptymalizowany przez agenta, pokonał większy, ręcznie skonfigurowany. obserwujemy, jak pętla badawcza zamyka się w czasie rzeczywistym. dyskutowaliśmy o tym na @modernmarket_