🚨 阿里巴巴剛剛開源了一個 GUI 代理,它可以在您的網頁內部運行,並用自然語言控制它。 它叫做 Page Agent,並不是瀏覽器擴展。 它是純 JavaScript,沒有 Python,沒有 Puppeteer,沒有無頭瀏覽器,沒有截圖。 只需一個 script 標籤,您的網頁應用就能理解自然語言。 這實際上做了什麼: → 只需一個 <script> 標籤或 npm 安裝即可嵌入 → 用簡單的英語命令控制任何網頁界面 → 基於文本的 DOM 操作,不需要 OCR,無需視覺模型 → 自帶 LLM(GPT、Claude、Qwen,任何都可以) → 提供內建 UI,支持人機協作 → 將 20 次點擊的 ERP/CRM 工作流程簡化為一句話 → 可選的 Chrome 擴展,用於多標籤代理任務 → 適用於任何網頁應用 SaaS、管理面板、內部工具 公司為基於這一想法構建的 AI 副駕駛收取每月 30 美元的費用。 這只需要 3 行代碼。 您的用戶。 您的界面。 每個網頁應用的 AI 副駕駛層現在已經開源。 1.6K 顆星。100% 開源。 (鏈接在評論中)