智象未來兩篇論文入選 CVPR 2025！視頻生成與虛擬換裝齊破局，開源賦能產(chǎn)業(yè)革新

砍柴網(wǎng) ? 3天前掃碼分享

我是創(chuàng)始人李巖：很抱歉！給自己產(chǎn)品做個(gè)廣告，點(diǎn)擊進(jìn)來看看。

近日，智象未來團(tuán)隊(duì)兩項(xiàng)創(chuàng)新性技術(shù)論文被CVPR 2025收錄，為視頻生成與虛擬換裝領(lǐng)域帶來雙重突破。兩項(xiàng)技術(shù)均已開源發(fā)布。

MotionPro：微動(dòng)作精準(zhǔn)生成

該技術(shù)顛覆傳統(tǒng)視頻生成模式，創(chuàng)新采用局部稀疏光流采樣精準(zhǔn)捕捉如眨眼、轉(zhuǎn)頭等微動(dòng)作，結(jié)合運(yùn)動(dòng)掩碼嚴(yán)格區(qū)分物體與相機(jī)運(yùn)動(dòng)。實(shí)驗(yàn)顯示其視頻-軌跡對(duì)齊精度提升19%，用戶滿意度（自然度/動(dòng)作符合性）分別領(lǐng)先 22% 和 18%，真正實(shí)現(xiàn)“所畫即所動(dòng)”。

DPIDM：視頻虛擬換裝新標(biāo)桿

該方案采用雙分支擴(kuò)散框架，結(jié)合動(dòng)態(tài)姿勢(shì)交互模塊（DPI），有效解決了服裝細(xì)節(jié)保持與視頻一致性的技術(shù)難題，顯著提升了虛擬試衣的真實(shí)感和時(shí)空連貫性。在VVT測(cè)試集上，其VFID分?jǐn)?shù)達(dá)0.506，較現(xiàn)有方法大幅提升60.5%，為營(yíng)銷場(chǎng)景提供真實(shí)動(dòng)態(tài)試穿體驗(yàn)。

隨意打賞

“鴻蒙開物開物成務(wù)——推動(dòng)浙江開源生態(tài)高質(zhì)量發(fā)展”圓桌會(huì)議在烏鎮(zhèn)圓滿舉行

砍柴網(wǎng) ? 4分鐘前

2025年6月14日，“鴻蒙開物開物成務(wù)——推動(dòng)浙江開源生態(tài)高質(zhì)量發(fā)展”圓桌會(huì)議在烏鎮(zhèn)圓滿舉行。本次會(huì)議由浙江數(shù)字經(jīng)濟(jì) 百人會(huì)、浙江大學(xué) 傳媒與國(guó)際文化學(xué)院、華為技術(shù)有限公司主辦，烏鎮(zhèn)數(shù)字文明研究院、浙江省圖靈互聯(lián)網(wǎng) 研究院、民進(jìn)浙江省委會(huì)開明智庫(kù)、Ch
阿里千問與DeepSeek入選全球AI開源貢獻(xiàn)榜前十

i黑馬 ? 2天前

6月12日，全球最大的AI開源社區(qū)Hugging Face發(fā)布了最新的AI開源貢獻(xiàn)榜，中國(guó)團(tuán)隊(duì)表現(xiàn)亮眼，阿里通義千問躋身全球第五、中國(guó)第一，DeepSeek位列第九，是前十中唯二的非美國(guó)機(jī)構(gòu)。據(jù)了解，該榜單由Hugging Face官方對(duì)全球開源模型的主要機(jī)構(gòu)進(jìn)行評(píng)估，考察指標(biāo)包括開源模型、數(shù)據(jù)集、開發(fā)者關(guān)注度、社區(qū)活
DeepSeek R1推理性能提升3.8倍，AMD發(fā)布下一代開源軟件棧技術(shù)ROCm 7

砍柴網(wǎng) ? 2天前

6 月 13 日消息，在今日凌晨的 AMD Advancing AI 2025 活動(dòng)中，AMD 正式推出其下一代開源軟件棧技術(shù) ROCm 7，進(jìn)一步加速 AI 與開發(fā)者生產(chǎn)力。隨著 ROCm 7 的發(fā)布，AMD 終于從其 ROCm 6 軟件棧向前邁進(jìn)，該軟件棧在過去幾年中 —— 尤其是在 AI 計(jì)算出現(xiàn)以來 —— 已經(jīng)
全球 AI 開源貢獻(xiàn)榜出爐，阿里千問躋身全球前五、中國(guó)第一

砍柴網(wǎng) ? 2天前

6 月 12 日，全球最大的 AI 開源社區(qū) Hugging Face 發(fā)布了最新的 AI 開源貢獻(xiàn)榜，中國(guó)團(tuán)隊(duì)表現(xiàn)亮眼，阿里通義千問躋身全球第五、中國(guó)第一，DeepSeek 位列第九，是前十中唯二的非美國(guó)機(jī)構(gòu)。據(jù)了解，該榜單由 Hugging Face 官方對(duì)全球開源模型的主要機(jī)構(gòu)進(jìn)行評(píng)估，考察指標(biāo)包括開源
阿里通義實(shí)驗(yàn)室開源檢索增強(qiáng)預(yù)訓(xùn)練框架MaskSearch

i黑馬 ? 4天前

據(jù)悉，阿里巴巴通義實(shí)驗(yàn)室發(fā)布并開源了MaskSearch預(yù)訓(xùn)練框架，讓AI學(xué)會(huì)“主動(dòng)搜索+多步推理”，從而更準(zhǔn)確、更智能地回答復(fù)雜問題。據(jù)介紹，MaskSearch 的核心在于它提出的一種全新預(yù)訓(xùn)練任務(wù) —— 檢索增強(qiáng)掩碼預(yù)測(cè)（RAMP），在這個(gè)任務(wù)中，模型需要填補(bǔ)句子中的掩碼部分，并且必須通過主動(dòng)搜索和多步推理來完
法國(guó)AI實(shí)驗(yàn)室Mistral推出推理模型Magistral系列，Small版已開源

砍柴網(wǎng) ? 4天前

6 月 11 日消息，法國(guó)人工智能實(shí)驗(yàn)室 Mistral 周二宣布進(jìn)軍推理人工智能模型領(lǐng)域。6 月 10 日，Mistral 正式推出其首個(gè)推理模型系列 ——Magistral。該系列模型通過分步驟解決問題，旨在提升在數(shù)學(xué)、物理等學(xué)科領(lǐng)域的一致性和可靠性，與 OpenAI 的 o3 模型和谷歌的 Gemini 2.5
OpenAI開源模型發(fā)布推遲至夏末，CEO奧爾特曼稱“非常值得等待”

砍柴網(wǎng) ? 4天前

6 月 11 日消息，OpenAI 的開源模型發(fā)布計(jì)劃出現(xiàn)了新的調(diào)整。該公司首席執(zhí)行官山姆?奧爾特曼（Sam Altman）在周二于 X 平臺(tái)上發(fā)布的一篇帖子中宣布，原計(jì)劃于今年初夏推出的開源模型預(yù)計(jì)將推遲至夏末發(fā)布，不會(huì)在 6 月與公眾見面。IT之家注意到，奧爾特曼在帖子中寫道：“我們將為開源權(quán)重模型多花一點(diǎn)時(shí)間，也
微軟開源發(fā)布Athena 智能體

i黑馬 ? 9天前

微軟公司發(fā)布博文，宣布Teams 應(yīng)用已整合名為 Athena 的 AI 智能體，目的是優(yōu)化產(chǎn)品開發(fā)流程，相關(guān)源代碼已開源托管在 GitHub 平臺(tái)上，供組織和個(gè)人定制使用。Athena 能處理代碼審查（Pull Request Reviews）、工作項(xiàng)管理和安全檢等繁瑣重復(fù)的任務(wù)，讓開發(fā)者專注于創(chuàng)新和功能開發(fā)。微軟表
阿里開源千問3向量模型，性能超越谷歌、OpenAI

砍柴網(wǎng) ? 9天前

6月6日，阿里開源通義千問3全新的向量模型系列 Qwen3-Embedding（簡(jiǎn)稱千問3向量模型）。該模型以千問3為底座，專門為文本表征、檢索和排序等核心任務(wù)進(jìn)行優(yōu)化訓(xùn)練，性能較上一版本可提升40% ，在 MTEB 等權(quán)威專項(xiàng)榜單中超越了谷歌、OpenAI?、微軟等公司的頂尖模型，攬獲同類模型的 SOTA 最佳性能表

評(píng)論

提交建議

<strike id="kqusc"></strike>