通過聲網對話式 AI 引擎,我15分鐘讓 DeepSeek 開口說話
近期,DeepSeek 旋風席卷全球,其獨有的深度思考+聯網模式讓用戶紛紛驚嘆好用,如果你想脫離與 AI 的文字互動,與 DeepSeek 進行更具真實感的語音對話,聲網的對話式 AI 引擎讓你15分鐘內就能做到。
今天,聲網對話式 AI 引擎 Beta 版也正式上線,支持開發者在 Console 后臺自行開通服務接入 API,并在 Playground 中實際調參、測試并生成代碼,僅需2行代碼,15分鐘即可部署基于大模型的對話式 AI Agent。
聲網對話式 AI 引擎官網也已同步上線,開發者在了解產品功能的同時,也可通過官網申請體驗最新的 Demo 應用。
5大能力讓你的大模型能說會道
1、 AI 語音秒回 : AI 秒回你的提問,語音對話延遲低至650ms。
2、 對話人聲鎖定 : 屏蔽95%環境人聲、噪聲干擾,精準識別對話人聲。
3、 智能打斷 : 模擬真人對話節奏,隨時打斷與 AI 的對話,響應低至340ms。
4、 全模型適配 :實現 DeepSeek、ChatGPT等全模型適配,更有音視頻 SDK 支持30000+終端機型適配,解決多設備兼容性的后顧之憂。
5、 不懼弱網: 地鐵、地下車庫等弱網環境下,人與 AI 也能流暢對話。
聲網對話式 AI 引擎 將為開發者帶來極致的對話體驗、極簡的開發部署, 即使像 ? DeepSeek ? 這樣的文本大模型也能快速轉變為對話式多模態大模型,具備能說會道的能力 。同時,對話式 AI引擎同樣支持基于阿里云、騰訊云的穩定滿血版 DeepSeek ,不用擔心出現“服務器繁忙,請稍后再試”。
如何快速部署對話式 ? AI? 引擎
開發者想要快速調用聲網對話式 AI 引擎 RESTful API 實現與 AI 語音互動,根據以下流程就可通過2行代碼,15分鐘快速實現從打開 Console 后臺到說『Hello Agent』,大幅降低開發門檻。
前提條件:
1、已在聲網 Console 控制臺開通服務,并獲得 App ID、臨時 Token、客戶 ID 和客戶密鑰等信息。
2、已聯系聲網技術支持為你的項目開通聲網對話式 AI 引擎。
3、你的 App 已實現基本的實時音視頻功能。
4、已獲取大模型提供商的 API key 和回調 URL。
5、已獲取文本轉語音 (TTS) 提供商的 API key。
滿足以上前提條件,就可實現與 Agent 的語音互動。具體流程如下圖所示:
總體來說部署流程分為三個核心步驟: 第一步:加入 RTC 頻道 ,在你的 App 中調用『 joinChannel 』加入一個 RTC 頻道。
第二步:創建對話式智能體 :調用『 創建對話式智能體』創建一個智能體實例,并傳入上一步中使用的頻道名和 Token 讓智能體加入同一個 RTC 頻道。完成該步驟后,聲網會推薦你前往“控制臺 - 對話式 AI 引擎 - Playground”快速體驗與 AI 對話,正確配置各項參數并完成體驗后,點擊右上角的 View code 復制自動生成的服務端 API 調用示例代碼。
第三步:停止對話式智能體 :結束對話后,調用『停止對話式智能體』,讓智能體離開 RTC 頻道。
更多具體的詳細部署流程可查看聲網官網的文檔中心。
此外,聲網對話式 AI 引擎 在 Beta 測試階段限時免費,歡迎各行各業的開發者參與部署并與我們交流。同時,也可通過聲網官網或在聲網公眾號找到這篇文章,掃描文章底部的二維碼,申請體驗聲網對話式 AI 引擎最新的 Demo 應用。