每週都有一個新的「AI代理框架」。 很少有人在問:「我們如何證明這個系統實際上做了什麼?」 這將成為一個首要問題。