久草视频2-久草视-久草社区视频-久草色在线-久草色视频-久草软件

蘋果攜手復旦大學推 StreamBridge 端側視頻大語言模型框架

砍柴網  ?  掃碼分享
我是創始人李巖:很抱歉!給自己產品做個廣告,點擊進來看看。  

5 月 13 日消息, 科技 媒體 marktechpost 今天(5 月 13 日)發布博文,報道稱 蘋果 公司聯合復旦大學, 推出 StreamBridge 端側視頻大語言模型(Video-LLMs)框架,助力 AI 理解直播流視頻。

直播流視頻理解的挑戰與需求

傳統視頻大語言模型擅長處理靜態視頻,但無法適應機器人技術和自動駕駛等需要實時感知的場景,在這些場景下,要求模型能快速理解直播視頻流內容,并做出反應。

現有的模型面臨兩大難題:一是多輪實時理解,即在處理最新視頻片段時需保留歷史視覺和對話上下文;二是主動響應,要求模型像人類一樣主動監控視頻流,并在無明確指令的情況下及時輸出反饋。

StreamBridge 框架與創新技術

為解決上述問題,蘋果公司與復旦大學的研究者開發了 StreamBridge 框架。該框架通過內存緩沖區和輪次衰減壓縮策略,支持長上下文交互。

蘋果攜手復旦大學推 StreamBridge 端側視頻大語言模型框架

該框架還引入了一個輕量化的獨立激活模型,無縫集成現有視頻大語言模型,實現主動響應功能。研究團隊還推出了 Stream-IT 數據集,包含約 60 萬個樣本,融合了視頻與文本序列,支持多樣化的指令格式,旨在提升流式視頻理解能力。

StreamBridge 在主流離線模型如 LLaVA-OV-7B、Qwen2-VL-7B 和 Oryx-1.5-7B 上進行了測試。結果顯示,Qwen2-VL 在 OVO-Bench 和 Streaming-Bench 上的平均分分別提升至 71.30 和 77.04,超越了 GPT-4o 和 Gemini 1.5 Pro 等專有模型。

Oryx-1.5 也取得了顯著進步,而 LLaVA-OV 性能略有下降。Stream-IT 數據集的微調進一步提升了所有模型的表現,證明了 StreamBridge 在流式視頻理解領域的強大潛力。

【來源: IT之家

隨意打賞

提交建議
微信掃一掃,分享給好友吧。
主站蜘蛛池模板: 无遮免费网站在线入口 | 久久精品AV一区二区无码 | 日韩一区二区三区免费 | 欧美一区二区三区四区在线观看 | 国产黄频在线观看高清免费 | 天天射夜夜爽 | 欧美一卡2卡三卡4卡5卡免费观看 | yellow高清免费 | 欧美人妖草草xxoo | 天堂avav| 小草视频免费观看在线 | 欧美一级h | 国产成人h综合亚洲欧美在线 | 干操视频| 精品免费国产一区二区三区 | 性绞姿始动作动态图 | 丝袜足液精子免费视频 | 日本一区二区三区四区无限 | 国产精品福利在线观看免费不卡 | 国产高清在线观看 | 好吊日在线 | 国产精品怡红院永久免费 | 99 久久99久久精品免观看 | 亚洲高清中文字幕 | 久久精品热只有精品 | 国产亚洲精品一区二区在线播放 | 亚洲精品AV无码喷奶水糖心 | 精品视频在线观看 | 午夜爱情动作片P | 国产精自产拍久久久久久 | 欧美一级特黄特色大片 | 倩女还魂在线观看完整版免费 | 奇米影视久久 | 精品在线小视频 | 欧美精品v欧洲高清 | 香蕉久久一区二区不卡无毒影院 | 嫩草视频在线观看视频播放 | 亚洲成年人在线观看 | 大胆人gogo888体艺术在线 | 亚洲骚图| 特黄级|