北京2025年12月4日 /美通社/ -- 亞馬遜云科技在2025 re:Invent全球大會上,宣布Amazon Bedrock AgentCore推出多項新功能。該平臺旨在支持企業在大規模環境中以安全的方式構建和部署Agent。Policy in Amazon Bedrock AgentCore功能幫助團隊為Agent的工具使用設定明確邊界;AgentCore Evaluations功能使團隊能夠了解Agent在實際場景中的表現。此外,亞馬遜云科技還推出了增強版記憶功能,使Agent能夠基于過往經驗進行改進,從而在后續交互中提供更貼合需求的洞察。
打造既具備自主能力又遵循行為邊界的企業級Agent
盡管Agent具備自主推理和行動的能力,使其極具價值,但企業必須建立健全的控制機制,以防止未授權的數據訪問、不當交互以及可能影響業務運營的系統級錯誤。即便經過謹慎設計的提示詞,Agent在實際應用中仍可能出現導致嚴重后果的失誤。
今天,亞馬遜云科技正式推出Policy in Amazon Bedrock AgentCore功能,用于幫助企業為Agent的操作設定清晰的邊界。團隊可以使用自然語言,通過定義Agent可訪問的工具和數據、可執行的操作以及適用條件,為其劃定具體范圍。這些工具可能包括API、Lambda函數、MCP服務器,或Salesforce、Slack等主流第三方服務。為保持Agent的響應速度,Policy in Amazon Bedrock AgentCore已集成至AgentCore Gateway中,可在毫秒級對Agent的操作進行校驗,以確認其是否符合既定策略要求,從而確保Agent在自主運行的同時始終處于設定范圍內。自然語言策略編寫方式進一步降低了策略創建的門檻,使客戶無需編寫正式策略代碼即可構建精細化規則。例如:"當退款金額高于1000美元時,阻止所有客戶退款操作"這樣的規則,可以直接用自然語言表述并得到一致執行,體現了亞馬遜一貫的"信任,但要驗證"原則,從而讓Agent在保持自主性的同時,始終處在合理的監管之下。
Druva是一家領先的數據安全解決方案提供商。Druva產品AI副總裁David Gildea表示:"在以往,當數據備份失敗時,客戶往往需要花費數小時,在數十個系統中手動排查日志。通過我們的AI Agent,客戶可以獲得即時分析和分步數據恢復補救方案。我們對在AgentCore中使用Policy功能感到非常期待,它可以幫助客戶為Agent訪問內部工具和數據(如備份系統、安全日志和監控看板)設定清晰邊界。有了適當的策略,開發人員便能在確保Agent始終符合合規邊界的前提下大膽創新,這使我們能夠在擴展Agent平臺的同時,保持企業客戶所期望的嚴格安全標準。"
全面掌握AI Agent的行為與結果
與傳統軟件指標不同,評估AI Agent的質量往往需要復雜的數據科學流程、主觀判斷以及持續的實時監控,而且每一次Agent更新或模型變更都會進一步加大這一挑戰。
AgentCore Evaluations功能簡化了原本復雜的評估流程,并免去了對評估基礎設施的管理需求,提供13個預置評估器,覆蓋正確性、實用性、工具選擇準確性、安全性、目標達成率和上下文相關性等常見質量維度。此外,開發者還可基于偏好的LLM和提示詞編寫自定義評估器。此前,僅構建一套評估系統就可能需要數月的數據科學投入。這項新功能會持續采樣Agent的實時交互數據,并根據正確性、實用性、安全性等預置標準分析Agent行為。開發團隊可設置預警機制實現主動質量監控,評估功能可用于測試與生產階段。例如,當客服Agent的滿意度評分在8小時內下降10%時,系統會立即觸發預警,以便在用戶體驗受到影響前及時采取措施。
Natera是一家領先的基因檢測與診斷企業。Natera軟件工程負責人Mirko Buholzer表示:"在Natera,我們正在借助AI Agent重塑腫瘤患者的診療體驗。目前,我們的團隊正投入大量精力,以確保在嚴格的醫療合規標準下,所有AI Agent都能保持穩定一致的質量與性能。AgentCore Evaluations將在這一過程中發揮關鍵作用,它通過準確率、實用性和患者滿意度等關鍵指標持續監控Agent表現。我們期待這些實時質量情報能夠幫助我們提前發現并解決問題。借助AgentCore Evaluations,我們有信心在大規模部署時,仍能保持對Agent可靠性的高標準要求,從而為患者提供更具變革性的醫療服務。"
打造越交互越智能的Agent
當下,大多數AI Agent在"記憶"能力上依然存在明顯短板。所謂記憶,往往只是在有限上下文窗口內保存短期信息,并會在每一次新交互時被重置,這使得Agent難以真正從生產環境中的過往成敗中學習。
AgentCore Memory填補了這一關鍵能力空白,使Agent能夠隨著時間推移形成對用戶的連貫認知。今日,AgentCore Memory的episodic記憶功能正式可用,使Agent能夠從過往經驗中學習,并將這些信息應用于后續交互。episodic記憶功能會以結構化方式記錄上下文、推理過程、操作及結果,隨后由另一Agent自動分析其中的模式,以優化決策。當Agent遇到類似任務時,可快速調取相關歷史信息,縮短處理時間,并減少對復雜自定義指令的依賴。例如,當用戶獨自出行時,Agent可能會在航班起飛前45分鐘安排前往機場的交通;三個月后,當用戶攜帶家人前往相同目的地時,Agent會根據以往家庭出行情況,將接送時間自動調整為提前兩小時。通過這種基于經驗的學習方式,Agent能夠根據實際表現數據做出更一致的決策,而不僅依賴預設規則。
S&P Global Market Intelligence為機構投資者、銀行和企業提供洞察以及領先的數據與技術解決方案。S&P Global Market Intelligence MI 企業技術和可持續發展技術負責人Helene Astier,表示:"我們近期構建了內部通用的Agentic工作流平臺Astra,但在整個分布式組織內編排復雜的多Agent工作流時面臨巨大挑戰。隨著數百個專門構建的Agent出現,狀態管理和上下文一致性維護變得愈發困難,這凸顯了對統一記憶層的需求。Amazon Bedrock AgentCore Memory通過在多Agent協調棧中實現集中式狀態檢查點,為我們提供了有效的解決方案。有了全新的eposodic記憶功能,我們的Agent可以從以往分析中學習,生成更加智能的洞察。過去,在Astra平臺上部署一個Agent往往需要數周時間;現在借助AgentCore,我們可以在幾分鐘內創建并部署一個Agent或MCP服務器。"
今天發布的這些創新,為客戶提供了專門為Agent設計的基礎設施,使團隊可以將時間和精力集中在業務創新上,而不是反復從零搭建AI基礎能力。如需了解更多關于Amazon Bedrock AgentCore新功能的詳細信息,請訪問官方博客及產品頁面。