熱門話題
#
Bonk 生態迷因幣展現強韌勢頭
#
有消息稱 Pump.fun 計劃 40 億估值發幣,引發市場猜測
#
Solana 新代幣發射平臺 Boop.Fun 風頭正勁
karpathy 的自動研究是一個大事情。
630 行 Python。 一個 GPU。 一個指標。
你在 markdown 文件中寫指令。 一個 AI 代理修改訓練代碼,運行 5 分鐘的實驗,檢查分數是否提高,保留或丟棄,重複。
每小時約 12 次實驗。 約 100 次過夜。
你去睡覺。 你醒來時會有一個更好的模型。
我將這個指向我的記憶系統。 讓它在我睡覺時運行過夜,優化回憶得分和信心閾值。
有趣的部分不是自動化。 而是 karpathy 說的角色轉變。 你不再寫 Python。 你在為一個代理寫 markdown 指令。 你的指令越好,結果就越好。
如果你一直在與代理一起構建,這聽起來很熟悉。
tobi lutke 已經在一個較小的模型上運行了它。 19% 的改進。 這個代理優化的小模型擊敗了一個較大的手動配置模型。
我們正在實時觀察研究循環的閉合。
在 @modernmarket_ 上討論過。
熱門
排行
收藏
