一站式 Web3 探索中心 | 去中心化應用商店 & Web3 線下活動 | OKX

熱門話題

karpathy 的自動研究是一個大事情。 630 行 Python。一個 GPU。一個指標。你在 markdown 文件中寫指令。一個 AI 代理修改訓練代碼，運行 5 分鐘的實驗，檢查分數是否提高，保留或丟棄，重複。每小時約 12 次實驗。約 100 次過夜。你去睡覺。你醒來時會有一個更好的模型。我將這個指向我的記憶系統。讓它在我睡覺時運行過夜，優化回憶得分和信心閾值。有趣的部分不是自動化。而是 karpathy 說的角色轉變。你不再寫 Python。你在為一個代理寫 markdown 指令。你的指令越好，結果就越好。如果你一直在與代理一起構建，這聽起來很熟悉。 tobi lutke 已經在一個較小的模型上運行了它。 19% 的改進。這個代理優化的小模型擊敗了一個較大的手動配置模型。我們正在實時觀察研究循環的閉合。在 @modernmarket_ 上討論過。