🔥 新研究:編碼代理真的能優化 GPU 推理代碼嗎? 我們建立了 ISO-Bench:來自 @vllm_project 和 @sgl_project 的 54 個真實優化任務,發現代理通常理解問題,但無法執行修復。