來火山引擎「算子廣場」,一鍵處理多模態數據
為應對企業數據處理從單一模態向多模態需求的轉變,火山引擎多模態數據湖方案持續升級。
8月13日,在 FORCE Link AI 創新巡展·青島站,火山引擎宣布旗下產品 AI 數據湖服務 LAS 上線“算子廣場” ,該功能進一步增強了企業對文本、圖像及音視頻的處理能力,加速企業知識資產的自動化流通與增值。
今年6月,火山引擎發布了AI數據湖服務LAS,作為大模型時代的數據底座,LAS適配多模態數據,提供湖存儲、湖管理、湖計算三大核心能力,助力企業釋放數據資產的全部價值。火山引擎數據產品解決方案負責人蕭然表示:"企業數據就像冰山,水面上能用的結構化數據只是小部分,水面下90%以上的非結構化數據長期‘沉睡’,每年消耗IT成本卻無法產生價值。”
算子廣場的推出,大幅降低了多模態數據處理的開發門檻 。通過將復雜的AI算法封裝成預置算子,企業無需從零開發,即可快速構建數據處理流程。
“算子廣場”將文檔解析、OCR 識別、視頻合成等用于處理數據的復雜 AI 能力進行封裝,提供了豐富的算子庫:其中包含100余種即插即用的標準化算子;集成主流開源算子庫,同時提供完整的開發框架,支持用戶封裝自定義算子,全面覆蓋文本、圖像、音視頻等多模態數據處理場景。
用戶通過 可視化拖拽 ,即可 快速編排模塊化工作流 ,無需編寫復雜代碼。這一開發方式使得多模態數據的開發難度大幅降低,減輕了企業對專業數據科學家和算法工程師的依賴。借助語義分塊、OCR識別、AI工作流編排等核心能力,企業能夠輕松將分散數據轉化為知識資產,真正實現從技術門檻到業務價值的跨越。
以 社交 平臺智能化內容審核為例,傳統人工審核面臨海量內容導致的效率瓶頸、人力成本高昂,以及內容遺漏帶來的合規風險。
火山引擎為該企業提供了多模態數據湖方案,在算子廣場能力的支撐下構建了自動化審核體系:
1.視頻逐幀解析: 自動抽取關鍵幀,分離畫面、音頻及字幕文本;
2.多模態特征提取: 利用OCR、語音識別、圖像分析等算子提取文本、語音和視覺特征;
3.融合判定決策: 結合多模態模型聯合分析特征,精準識別風險內容。
實際應用效果顯示,該方案將內容審核覆蓋率提升至99.5%,對非結構化音視頻數據識別的準確性與時效性都顯著提升,大幅減少了人工復審工作量。算子廣場的可視化編排功能還可適應審核策略的靈活調整提供,幫助平臺快速應對新出現的違規內容類型。
算子廣場的推出,進一步完善了火山引擎多模態數據湖解決方案的能力版圖。針對AI應用開發面臨的多模態數據整合難、技術門檻高、資源調度復雜等挑戰,火山引擎多模態數據湖解決方案支持全類型數據統一處理,并深度集成主流大模型快速部署場景化應用,通過基于任務類型的動態資源調度技術,保障高并發性能。
該方案切實降低了AI應用開發門檻,提升數據處理效率與智能化水平,支撐企業在內容安全、知識管理等場景實現效能突破。隨著數據處理能力向智能化、自動化持續演進,多模態數據湖正成為企業釋放數據價值的關鍵路徑。