Nghiên cứu tự động của Karpathy là một điều lớn. 630 dòng Python. Một GPU. Một chỉ số. Bạn viết hướng dẫn trong một tệp markdown. Một tác nhân AI sửa đổi mã huấn luyện, chạy một thí nghiệm 5 phút, kiểm tra xem điểm số có cải thiện không, giữ lại hoặc loại bỏ, lặp lại. ~12 thí nghiệm mỗi giờ. ~100 thí nghiệm qua đêm. Bạn đi ngủ. Bạn thức dậy với một mô hình tốt hơn. Tôi đang chỉ vào hệ thống bộ nhớ của mình. Để nó chạy qua đêm tối ưu hóa điểm số hồi tưởng và ngưỡng độ tin cậy trong khi tôi ngủ. Phần thú vị không phải là tự động hóa. Đó là những gì Karpathy đã nói về sự thay đổi vai trò. Bạn không còn viết Python nữa. Bạn đang viết hướng dẫn markdown cho một tác nhân. Hướng dẫn của bạn càng tốt, kết quả càng tốt. Nghe quen thuộc nếu bạn đã xây dựng với các tác nhân. Tobi Lutke đã chạy nó trên một mô hình nhỏ hơn. Cải thiện 19%. Mô hình nhỏ được tối ưu hóa bởi tác nhân đã đánh bại một mô hình lớn hơn được cấu hình thủ công. Chúng ta đang theo dõi vòng nghiên cứu khép kín trong thời gian thực. Đã thảo luận về điều này trên @modernmarket_