智象未來兩篇論文入選 CVPR 2025!視頻生成與虛擬換裝齊破局,開源賦能產(chǎn)業(yè)革新
近日,智象未來團(tuán)隊(duì)兩項(xiàng)創(chuàng)新性技術(shù)論文被CVPR 2025收錄,為視頻生成與虛擬換裝領(lǐng)域帶來雙重突破。兩項(xiàng)技術(shù)均已開源發(fā)布。
MotionPro:微動(dòng)作精準(zhǔn)生成
該技術(shù)顛覆傳統(tǒng)視頻生成模式,創(chuàng)新采用局部稀疏光流采樣精準(zhǔn)捕捉如眨眼、轉(zhuǎn)頭等微動(dòng)作,結(jié)合運(yùn)動(dòng)掩碼嚴(yán)格區(qū)分物體與相機(jī)運(yùn)動(dòng)。實(shí)驗(yàn)顯示其視頻-軌跡對(duì)齊精度提升19%,用戶滿意度(自然度/動(dòng)作符合性)分別領(lǐng)先 22% 和 18%,真正實(shí)現(xiàn)“所畫即所動(dòng)”。
DPIDM:視頻虛擬換裝新標(biāo)桿
該方案采用雙分支擴(kuò)散框架,結(jié)合動(dòng)態(tài)姿勢(shì)交互模塊(DPI),有效解決了服裝細(xì)節(jié)保持與視頻一致性的技術(shù)難題,顯著提升了虛擬試衣的真實(shí)感和時(shí)空連貫性。在VVT測(cè)試集上,其VFID分?jǐn)?shù)達(dá)0.506,較現(xiàn)有方法大幅提升60.5%,為 營(yíng)銷 場(chǎng)景提供真實(shí)動(dòng)態(tài)試穿體驗(yàn)。