大模型驅(qū)動數(shù)據(jù)分析范式重構(gòu),騰訊云Data+AI實踐亮相2025數(shù)據(jù)智能大會
在6月18日中國通信標準化協(xié)會主辦的2025數(shù)據(jù)智能大會上,騰訊云大數(shù)據(jù)TBDS產(chǎn)品中心總經(jīng)理徐曉敏發(fā)表主題演講,系統(tǒng)闡釋了大模型(LLM)對數(shù)據(jù)分析范式的深刻變革,并分享了騰訊云在Data+AI融合方向的最新實踐。他表示,大模型正重塑數(shù)據(jù)處理架構(gòu)、分析方法、治理需求與運維模式,騰訊云已構(gòu)建起覆蓋底層存儲到上層應(yīng)用的完整Data+AI技術(shù)體系。
進入LLM時代,數(shù)據(jù)處理和分析正加速演進。計算從CPU走向CPU+GPU混合,治理對象從結(jié)構(gòu)化數(shù)據(jù)拓展到文本、圖像、音視頻等多模態(tài)數(shù)據(jù),分析方式從規(guī)則建模向語義理解驅(qū)動的智能分析轉(zhuǎn)變,運維從人工修復邁向自動化響應(yīng)。資源管理正依托動態(tài)優(yōu)化,交互方式從SQL遷移到自然語言,人機協(xié)作也從工單驅(qū)動進化為智能聯(lián)動。
應(yīng)對這些變化,騰訊云構(gòu)建了以統(tǒng)一元數(shù)據(jù)視圖為核心的堅實底座。通過TBDS-Catalog,平臺打通了Hive、Iceberg、MPP數(shù)倉等結(jié)構(gòu)化源與圖像、音視頻、模型等非結(jié)構(gòu)數(shù)據(jù),實現(xiàn)統(tǒng)一的元數(shù)據(jù)視圖和權(quán)限管理。該服務(wù)兼容Hive Metastore,便于承接歷史資產(chǎn),并通過高性能JDBC優(yōu)化大表處理效率。面向AI場景, TBDS-Catalog可統(tǒng)一管理模型文件和訓練數(shù)據(jù),保障非結(jié)構(gòu)數(shù)據(jù)高效可控。
在架構(gòu)層,騰訊云基于Lakehouse構(gòu)建了支持批處理、流計算、交互式查詢和AI訓練的統(tǒng)一平臺,靈活調(diào)度Spark、Flink、StarRocks等計算引擎。Wedata開發(fā)平臺融合DataOps與MLOps,支持結(jié)構(gòu)化與非結(jié)構(gòu)化數(shù)據(jù)資產(chǎn)的統(tǒng)一開發(fā)、編排與治理。
為降低使用門檻,騰訊云推出了自然語言驅(qū)動的ChatBI。用戶無需掌握SQL,只需通過自然語言提問,即可獲取實時數(shù)據(jù)結(jié)果。系統(tǒng)還能自動解讀數(shù)據(jù)、識別波動并進行歸因分析,大幅提升業(yè)務(wù)響應(yīng)效率。
在非結(jié)構(gòu)化數(shù)據(jù)分析方面,騰訊云推出AI-Search平臺(騰訊云ES),打造覆蓋語義理解、向量化、檢索和生成的一站式RAG平臺。該系統(tǒng)支持復雜文檔解析與混合搜索,已廣泛應(yīng)用于“ 微信 讀書AI問書”、“ima工作臺”等場景,借助ES-RAG技術(shù)實現(xiàn)生成式回答和問題推薦。騰訊云也是首個通過信通院《檢索增強生成技術(shù)要求》標準認證的企業(yè)。
在運維治理上,騰訊云通過“大數(shù)據(jù)智能管家”構(gòu)建了閉環(huán)自治體系,覆蓋從數(shù)據(jù)采集、異常診斷到資源優(yōu)化的全鏈條。系統(tǒng)通過智能模型提升資源利用率達60%,并支持故障自愈和策略自動演進,顯著降低運維成本。
這些能力已在騰訊內(nèi)外全面落地。目前,騰訊云大數(shù)據(jù)已服務(wù)2000多家政企客戶,節(jié)點規(guī)模超10萬。騰訊云將持續(xù)推動Data+AI融合,為行業(yè)釋放更大數(shù)據(jù)智能價值。