企業級AI的未來:IBM實現通用型企業級AI智能體的重大突破
在AI發展日新月異的今天,AI智能體無疑正處在技術前沿。近日,IBM發布了 通用型企業級AI智能體 (IBM Computer Using Generalist Agent,此后簡稱IBM CUGA)的重要突破,引發業界廣泛關注。繼 Think 2025大會上發布AI 智能體平臺watsonx Orchestrate后,IBM研究院在企業級智能體領域再次邁出了實質性的一大步。
如今,IBM CUGA不僅在模擬企業場景中經受住了嚴苛測試,更在最新(2025年7月)的 AppWorld Benchmark 中榮登第一 (注:AppWorld Benchmark 是一個由多個研究機構和學者共同創建、用于評估交互式編程智能體的基準測試環境)。在不久的未來,我們或許能看到AI 智能體逐步從“實驗室玩具”邁向“企業核心助手”。
通用型企業級AI智能體是什么?為何重要?
傳統AI智能體在企業應用中多是“單一功能專家”——比如處理發票、生成郵件、跟蹤銷售進度等。這些功能雖然實用,但面對跨流程、跨系統、跨業務的復雜場景時,往往會顯得力不從心。
IBM CUGA 正是為復雜業務場景而生。它是一種能夠 跨多個業務場景、整合多種工具、執行復雜任務的通用型智能體 ,可以像資深員工一樣理解用戶意圖、規劃任務、調用工具、協調多個系統,并不斷學習和適應新的挑戰。
榮耀背后,是技術進階和厚積薄發
IBM CUGA的出現并不是一蹴而就的,它是 架構進化、方法創新和工具集成 的系統性成果:
·? 架構演進 :從最初簡單的“計劃-執行-觀察”模型(完成率15%),進化到如今能協調多個子智能體、感知網頁環境、處理復雜任務的多層級系統, 任務完成率提升到 61.7% 甚至更高 。[i]
·? 工具賦能 :
o? 實時性能儀表盤 ,掌握每一個智能體動作的效果;
o? 軌跡可視化工具 ,直觀診斷失敗原因;
o? 并行執行框架 ,將評估速度從數天壓縮到數分鐘。
·? 多智能體協作 :一個任務由多個“子任務智能體”協同完成。比如,規劃、執行、信息提取各司其職,讓智能體能像團隊一樣作戰。
·? 環境感知增強 :結合網頁截圖和可訪問性樹,智能體看得更清、操作更準,還能識別彈窗等障礙進行規避。
安全、可信、可控的智能體平臺,打造適配業務需求的AI智能體
IBM不僅關注智能體的“聰明程度”,更重視它的“ 企業適配能力 ”。借助最新發布的企業級AI 智能體平臺watsonx Orchestrate,客戶有望實現:
·? 全生命周期可觀測性 ,兼顧性能監控、模型優化、安全防護;
·? 無代碼與專業工具并存 ,既支持業務人員快速部署,也支持開發者深度定制;
·? 兼容超過80種企業級系統 ,與Adobe、SAP、Salesforce、ServiceNow等生態無縫集成;
·? 治理與合規 ,為隱私、安全、成本可控提供保障,幫助企業實現AI治理與合規。
真正的“ 企業AI助手 ” 正在加速來到
除了在AppWorld基準測試奪魁,IBM CUGA還在WebArena等真實瀏覽器任務中展現強大能力。通過“智能采樣”、“反饋反射”、“知識注入”等一系列創新方法, CUGA每一次迭代都更接近企業級實用標準 。
IBM CUGA不是實驗室的“炫技”,而是指向未來企業運營方式的變革。 在準確率達到更高門檻后,CUGA有望成為企業內部的通用調度平臺 ——不再是被動響應用戶指令,而是主動協助完成復雜的工作任務,例如跨系統的數據整合、文檔生成、流程管理等。
團隊心聲
“CUGA的成功,不是因為某一個神奇的模型,而是靠IBM團隊對創新的執著、對真實企業需求的深刻理解。感謝每一位參與其中的工程師、研究員和產品經理。”(作者:吳敏達,IBM 科技 事業部數據與人工智能資深技術專家)
作者簡介 :吳敏達是 The Open Group 卓越級技術專家(Distinguished Technical Specialist),同時擁有計算機技術與軟件專業系統架構設計師技術資格。他現在是 IBM 科技事業部數據與人工智能資深技術專家,擁有 20 多年數據分析軟件相關技術經驗,是 IBM 認證的大數據架構師和 Watson 開發者,專長是大數據、人工智能等領域。他是 IBM Developer 的大師級作者,已經發表了 40 余篇技術文章和教程。現從事大數據、人工智能相關技術支持和架構設計工作。
參考資料
[i]?數據來源:IBM CUGA開發者網頁