Poți face lucruri în prime-rl – cum ar fi să înveți GLM5 să răspundă la matematică în <2000 de tokenuri folosind 16 noduri pentru antrenament și 12 noduri pentru a face inference cu configurație 2P4D, doar UV run rl @ rl.toml (mi-@samsja19 spus că ar trebui să tweet mai multe lucruri)