谷歌Meet視頻會議平臺將引入Gemini AI同傳:還原語調(diào)、情感及音色特征
5月21日,在Google I/O 2025開發(fā)者大會上,谷歌宣布將其實時語音翻譯技術(shù)深度整合至Meet視頻會議平臺。基于Gemini大模型的實時翻譯功能現(xiàn)已向Pro、Ultra訂閱用戶開放,企業(yè)版預(yù)計2025年晚些時候進(jìn)行推廣。該技術(shù)突破性實現(xiàn)了語音翻譯過程中對原聲語調(diào)、情感及音色特征的還原。
目前該功能支持英語與西班牙語雙向互譯,意大利語、德語、葡萄牙語版本將于未來幾周上線。
在大會上,谷歌推出了一款名為Google Beam的全新平臺,這一技術(shù)源自其此前備受關(guān)注的3D視頻通話項目——Project Starline。Project Starline自2021年首次亮相以來,便以其突破性的3D全息視頻通話技術(shù)吸引了廣泛關(guān)注。這項技術(shù)通過多攝像頭捕捉用戶的不同視角,并利用人工智能實時渲染出逼真的三維影像,從而為遠(yuǎn)程溝通帶來前所未有的沉浸式體驗。
谷歌計劃在今年晚些時候與惠普合作推出首批Google Beam設(shè)備。
谷歌還公布了一項名為“Project Mariner”的全新AI智能體項目,這一項目最初被稱為“Jarvis”,并在去年年底進(jìn)行了初步測試,如今迎來了新的進(jìn)展。
Project Mariner能夠理解和推理瀏覽器頁面中的信息,包括像素、文本、代碼、圖像和表單等元素。用戶只需通過簡單的指令,Mariner就可以自動完成復(fù)雜的任務(wù),為用戶提供個性化的服務(wù)。此外,智能體模式即將上線Chrome、搜索和Gemini應(yīng)用。
【來源: 鳳凰網(wǎng) 科技 】