高德地圖攜手通義實驗室,深度共建全球首個AI原生出行智能體 | 速途網
速途網8月12日消息(報道:李楠)在AI原生浪潮推動下,阿里巴巴集團旗下高德地圖與通義實驗室宣布達成深度合作,并在近日發布的高德地圖2025版本中落地多項共建成果。
雙方圍繞語音交互、大模型能力以及Agent等核心方向展開全面協同,共同推動高德地圖從“連接世界”邁向“理解世界”的全新階段。
全鏈路語音共建:更精準、更自然的交互體驗
作為全球首個AI原生地圖應用,高德地圖2025的核心亮點之一,是推出業內首個專精出行生活的智能體“小高老師”,它可基于音頻、文本輸入等多模態方式,與用戶直觀交互。
在語音能力上,高德與通義實驗室語音團隊聯合打造了覆蓋喚醒、識別、理解、播報等環節的全鏈路能力,助力“小高老師”實現了行業領先的識別精度和交互流暢度。
雙方構建的新一代語音語義感知系統,由高德導航專用ASR(語音識別)模型 、通用領域大模型ASR、高德大模型綜合理解能力等模型組成,全面覆蓋導航、本地生活、日常閑聊三大場景。
此外,全雙工語音技術的應用,讓用戶體驗“小高老師”時可隨時打斷并發起新指令;抗回聲處理則確保用戶在復雜聲學場景下依然能保持清晰、順暢的交互體驗。
大模型底座加持:通義Qwen賦能空間理解
在用戶使用過程中,“小高老師”能高效調度高德內部近百種工具,將內外部數據資源整合分析,生成最佳回答反饋和地圖交互動作。
支撐這一能力的,是高德和通義共建的大模型簇——該模型簇由多模態空間感知、行為認知、時空意圖理解、總結輸出交互和反饋觀測評估等多個專業模型構成。
通義大模型具備全球領先的預訓練規模與語義理解能力:Qwen2.5已在18萬億token上完成預訓練,而 Qwen3的數據量幾乎翻倍,達到約36萬億token。
憑借強大的底座能力,通義大模型已成為全球主流的基座模型之一。綜合Hugging Face、魔搭等社區數據,Qwen系列大模型的下載量已達4億次,同時衍生模型數量超過14萬個,位居全球第一。
基于通義Qwen模型的底座能力,高德通過SFT(指令微調)訓練,顯著提升了其在出行生活場景中的語義理解、上下文感知與響應能力。
智能Agent登場:出行決策化繁為簡
在Agent領域,基于高德自研的DeepResearch框架,通義實驗室和高德聯合開發了地圖領域的復雜POI推理Agent,可通過理解多重約束條件、有效使用地圖和搜索工具以及整合實時聯網信息,為用戶提供精準的POI推薦與導航服務。
該DeepResearch框架融合了強大的規劃(Planning)、反思(Reflection)和工具調用(Tool Calling)機制,具備對高德地圖全棧工具的深度理解和使用能力,能夠智能地拆解復雜任務、評估執行路徑并高效協調各類工具。
基于此框架開發的推理Agent具備三大能力:
首先,基于雙方共建的高德專屬推理能力模型,該Agent具備了地圖領域領先的多維POI推理能力,可實現復雜時空需求的理解以及復雜 POI的解析及處理,支持對事件、地理、參與者、時間、交通、POI屬性等多重約束的綜合判斷;
其次,該Agent為高德預置了專屬地圖API、實時天氣查詢、交通狀況監測、POI數據查詢API等工具,并能基于POI理解自主調度相關工具。同時,它還能輕松集成新的工具和數據源,以適應不斷變化的場景需求,無論是新增的POI類型、交通方式還是實時數據,都能快速適配并提供相應服務。
最后,該Agent可實現復雜場景下的POI任務處理,例如多POI路線規劃、實時約束下的POI推薦、定制化POI推薦以及長時間旅行規劃建議等。
“模型+場景”深度融合:AI能力落地的行業范式
此次合作,不僅是高德與通義實驗室技術能力的疊加,更是生態協同共建的深度實踐。通義大模型的泛化能力與高德在空間場景上的深度積累,在AI原生地圖中實現了前所未有的深度融合。
一方面,高德以通義大模型為AI底座,構建了具備理解真實世界能力的空間智能,這不僅賦能高德地圖APP迭代升級,未來還能驅動智能汽車、智能眼鏡、具身智能、低空飛行等領域的變革。
另一方面,通義實驗室則通過高德地圖這一海量用戶場景,推動大模型能力的真實落地與驗證,加速其在C端產品中的規模化應用。
可以預見,高德與通義實驗室的合作將成為“模型+場景”跨域融合的行業范式,為AI能力在更多真實世界場景中的落地提供可復制的實踐經驗。