karpathy 的自動研究是一個大事情。 630 行 Python。 一個 GPU。 一個指標。 你在 markdown 文件中寫指令。 一個 AI 代理修改訓練代碼,運行 5 分鐘的實驗,檢查分數是否提高,保留或丟棄,重複。 每小時約 12 次實驗。 約 100 次過夜。 你去睡覺。 你醒來時會有一個更好的模型。 我將這個指向我的記憶系統。 讓它在我睡覺時運行過夜,優化回憶得分和信心閾值。 有趣的部分不是自動化。 而是 karpathy 說的角色轉變。 你不再寫 Python。 你在為一個代理寫 markdown 指令。 你的指令越好,結果就越好。 如果你一直在與代理一起構建,這聽起來很熟悉。 tobi lutke 已經在一個較小的模型上運行了它。 19% 的改進。 這個代理優化的小模型擊敗了一個較大的手動配置模型。 我們正在實時觀察研究循環的閉合。 在 @modernmarket_ 上討論過。