一站式 Web3 探索中心 | 去中心化应用商店 & Web3 线下活动 | OKX Wallet

热门话题

#

Bonk 生态迷因币展现强韧势头

#

有消息称 Pump.fun 计划 40 亿估值发币，引发市场猜测

LAUNCHCOIN+4.68%

#

Solana 新代币发射平台 Boop.Fun 风头正劲

header

Bret Taylor

联合创始人 @SierraPlatform.董事会@OpenAI。

Bret Taylor

Bret Taylor3月11日 00:05

与@collision进行了一场关于软件工程未来和Sierra的有趣对话，喝了几杯啤酒。

79

Bret Taylor

Bret Taylor3月10日 09:00

Harness 元基准想法：一个基本代理工具的集合（AGENTS.md，文档，技能，钩子），封装了非平凡的应用程序，每个应用程序都有一个单一的提示，可以从头开始一次性构建应用程序。当新的编码代理或模型发布时，我们可以对照工具直接与之前的模型版本进行比较。“这个模型从标准浏览器工具中从头编写了一个浏览器，功能完整性为X%，仅用Y行代码在Z小时内完成，费用为$XYZ。” 想象一下，通过每次后续模型更新的视角看到Cursor开发的那个浏览器。代码有多好？渲染器有多快？功能集有多完整？代理运行了多长时间？代币的总成本是多少？有点像CSS Zen Garden（它在推动浏览器标准方面做了很多工作）为代理工具。我觉得我们所有人都体验过Codex 5.4 Extra High的不同（如果没有，请立即停止阅读这篇文章并尝试一下），但我们仍然没有办法在基准中捕捉到作为开发者使用它的定性体验，特别是在架构和代码质量等度量方面。

749

热门

排行

收藏

©2017 - 2026 WEB3.OKX.COM

简体中文繁體中文 English Tiếng Việt Русский Español (Latinoamérica)Bahasa Indonesia Français Deutsch Italiano Polski Čeština Română Português (Portugal)Português (Brasil)Українська Español (España)Nederlands العربية 日本語 Norsk (bokmål)Suomi Svenska Türkçe

关于 OKX Wallet

下载学院关于我们就业机会联系我们服务条款隐私政策 X (原推特)

产品

行情币币兑换市场赚币开发者中心浏览器安全

用户支持

帮助中心官方渠道验证公告 DEX 费率标准加入社群比特币钱包以太坊钱包 Solana 钱包