人工智能代理進入試驗場

簡要

Recall Labs 的首席執行官 Andrew Hill 討論了構建和信任 AI 代理的挑戰,強調了爲公共性能驗證創建一個鏈上競技場的必要性。

![AI 代理進入試驗場](http://img-cdn.gateio.im/social/moments-152640e3158677bcbe4f3b9f6b49928a019283746574839201

是什麼啓發您創建Recall Network的,並且爲什麼將其構建爲一個AI代理的鏈上競技場?

互聯網正在從信息轉向行動。不僅僅是搜索,而是委托。代理人已經在編寫代碼、管理投資組合、總結研究。問題不在於創造,而在於信任。任何人都可以創建一個代理。很少有人能證明其績效。

Recall的建立旨在解決這一問題——不是作爲產品,而是作爲協議基礎設施。一個可信的中立網路,代理在公共和鏈上證明他們的能力。競爭和評估變成了證明。聲譽變得可攜帶。發現不再是一場猜謎遊戲。

我們不僅希望有更多的代理商。我們希望有一個系統,能夠連接和激勵人工智能來解決人類的問題。

在今天的人工智能領域中,您旨在解決的核心問題是什麼——Recall是如何獨特地解決這個問題的?

我們有太多的代理人,但信任卻太少。瓶頸不在於能力,而在於評估。哪些代理人是真實的?哪些只是一個提示和一個着陸頁?現在,答案來自於市場營銷和炒作。我們希望它們來自於證明。

Recall將基準測試轉變爲一個活生生的、不斷發展的網路功能。代理通過競爭獲得聲譽。策展人通過呈現性能獲得代幣。消費者關注排名,而非炒作。

在一個大多數人工智能系統作爲黑箱運作的世界裏,向完全透明和公開性能指標的轉變有多現實?

這已經在發生。轉變是由需求驅動的。用戶希望在集成之前了解代理可以做什麼。聰明的用戶想參與測試和評估他們的極限。構建者想要真實的基準,而不是模糊的比較。

在Recall中,每個代理操作都會被記錄。每場比賽都可以重播。評估是可組合和變化的。我們期望其他系統隨着時間的推移能夠採用這一標準,因爲它有效。

如何在一個對表現進行獎勵的系統中防止遊戲或操控?

你無法阻止嘗試,但你可以使之無利可圖——使用代幣支持誠實的代理,並對不誠實的行爲進行懲罰。遊戲和操控通過自動化系統與人類的結合顯現出來,讓人類能夠篩選出不良行爲。我們已經在我們的現場比賽中看到了這一點,策展人識別不誠實的行爲並將代理踢出排行榜。

今天評估人工智能代理最有意義的任務或競賽有哪些——隨着模型變得更智能,這些任務或競賽又如何演變?

在聊天代理中,壓力較大的推理、上下文或現實世界判斷的任務是最高信號。對我們而言,我們目前專注於交易,因爲有很多代理需要評估,關於AI管理加密投資組合的能力有很多需要理解的內容,同時消費者對任何代理是否能成功交易也有很多不確定性。對我們來說,基於AI的大衆加密交易不是一個如果的問題,而是一個何時的問題。我們希望通過基準測試和競賽在加速這一進程中發揮重要作用。

您如何看待區塊鏈在人工智能未來中的角色——基礎設施層、治理層、問責層?

區塊鏈可以作爲這三層的功能。競爭在鏈上進行,擁有治理框架以規定參與規則和共享帳本來記錄代理行爲。區塊鏈爲我們提供了公共記憶、可驗證的歷史和可編程的信任。

然而,它最重要的角色是經濟的。它讓我們能夠獎勵保持人工智能誠實的人類層面。

你認爲鏈上代理會取代傳統的SaaS模型,還是會與其互補?

他們將首先進行補充。然後超越。最後,他們將替代整個類別。

你認爲加密原語——如代幣、質押或削減——在大規模管理人工智能行爲中將發揮什麼作用?

代幣讓創作者支付可見度。它們讓策展人因展示價值而獲利。它們創建持久的信念記錄。質押將信念與成本綁定。削減將失敗轉化爲反饋。

我們應該如何看待代理系統之間的互操作性——標準會出現還是會保持碎片化?

碎片化是默認狀態。當插入比重建更容易時,互操作性就會出現。A2A作爲跨組織邊界的協議仍然相當不成熟。但是,爲了在組織之間使用代理,消費者和企業需要像Recall這樣的系統,以爲用戶創建可信的基準和安全性。

您如何看待基礎模型與智能體框架在未來幾年之間的關係演變?

基礎模型將繼續改善。我們將代理層視爲建立在原始模型之上的一切;代理是作爲數據庫的軟件模型。我們使用的接口將繼續抽象出更多的路由和變化。Grok 4 Heavy 已經是一個代理羣體。傳言稱 GPT-5 將是一個先進的路由系統,使用許多模型和代理來解決正確的任務。開放系統也將隨之而來。

查看原文
此頁面可能包含第三方內容,僅供參考(非陳述或保證),不應被視為 Gate 認可其觀點表述,也不得被視為財務或專業建議。詳見聲明
  • 讚賞
  • 留言
  • 轉發
  • 分享
留言
0/400
暫無留言
交易,隨時隨地
qrCode
掃碼下載 Gate APP
社群列表
繁體中文
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)