DeepSeek勸不了谷歌們
過去一個(gè)月,DeepSeek以大約十分之一的訓(xùn)練成本,推出與OpenAI o1性能接近的開源模型R1, “小力出奇跡”的新范式震撼全球AI大模型行業(yè)。 同時(shí),外界對(duì)于大型科技公司動(dòng)輒數(shù)百億美元的AI研發(fā)開支,也產(chǎn)生了越來越多的質(zhì)疑。
但被“DeepSeek沖擊”嚇了一跳的科技巨頭,并沒有因此改弦更張。相反,他們正揮舞著支票簿,試圖 靠瘋狂砸錢,重新奪取AI大模型的制高點(diǎn)。
2月5日,谷歌母公司Alphabet發(fā)布2024年第四季度財(cái)報(bào),營收和凈利潤均實(shí)現(xiàn)兩位數(shù)百分比的同比增長。引人注目的是,Alphabet宣布,2025財(cái)年的資本支出將達(dá)到750億美元 (約合人民幣5454億元) ,以繼續(xù)擴(kuò)展其人工智能戰(zhàn)略。
一年投入750個(gè)“小目標(biāo)”研發(fā)AI,遠(yuǎn)遠(yuǎn)超出了華爾街599.4億美元的預(yù)期。不過,谷歌有實(shí)力如此燒錢:截至去年底,它持有現(xiàn)金、現(xiàn)金等價(jià)物及有價(jià)證券約957億美元。
稍早時(shí)候,谷歌還向AI明星創(chuàng)業(yè)公司Anthropic追加投資10億美元。2023年至今,谷歌向這家公司累計(jì)投資35.5億美元。
財(cái)大氣粗的谷歌投身AI燒錢競賽,其他科技巨頭也不遑多讓。
今年1月初,微軟宣布將于2025財(cái)年投資800億美元,建設(shè)AI數(shù)據(jù)中心。這筆投資創(chuàng)下了微軟成立以來的單筆投資最高紀(jì)錄。而在上一財(cái)年,微軟的資本支出超500億美元,大部分用于AI相關(guān)的基礎(chǔ)設(shè)施。
社交網(wǎng)絡(luò)巨頭Meta在1月底宣布,公司將在今年投資600億~650億美元,并大幅擴(kuò)張AI團(tuán)隊(duì),以期實(shí)現(xiàn)Meta AI服務(wù)10億人、Llama 4成為行業(yè)領(lǐng)先大模型的目標(biāo)。Meta創(chuàng)始人扎克伯格稱, 今年將是“AI決定性的一年”。
OpenAI則拉上軟銀、甲骨文、微軟、ARM、英偉達(dá)以及中東人工智能基金 (MGX) 等產(chǎn)業(yè)和投資巨頭,預(yù)計(jì)投資5000億美元,聯(lián)手成立“星際之門”,這些資金將被用于數(shù)據(jù)中心等AI基礎(chǔ)設(shè)施的建設(shè)與運(yùn)營。
相比之下,國內(nèi)科技巨頭面向AI大模型的砸錢規(guī)模小了一個(gè)數(shù)量級(jí),但也動(dòng)輒數(shù)百億元,且增長很快。
根據(jù)財(cái)報(bào)等公開信息,2024年前三季度,百度、阿里、騰訊的總資本開支約為人民幣867億元。金融數(shù)據(jù)服務(wù)商Visible Alpha預(yù)計(jì),到2027年,BAT的資本支出將達(dá)到1767億元,年復(fù)合增長率超26%。考慮到BAT的重視程度, 這些資本開支將有很大一部分流向AI大模型。
不難看出,科技巨頭發(fā)展AI大模型,砸錢仍然是基本武器之一。盡管DeepSeek證明了“小力出奇跡”的可行性,但巨頭們出于多種原因,仍然沿著“大力出奇跡”的路線前行。
這并非僅僅是大公司的慣性使然。OpenAI剛剛發(fā)布的o3-mini,已經(jīng)在物理推理等多項(xiàng)指標(biāo)上反超R1,而更強(qiáng)大的o3標(biāo)準(zhǔn)版也已經(jīng)箭在弦上。這也再次證明, “尺度定律”仍然是AI大模型的基本規(guī)則之一,而“小力出奇跡”并非置之四海而皆準(zhǔn)。
尚未找到“金主爸爸”的DeepSeek,在算力、數(shù)據(jù)、資金和資源方面比不上巨頭,正面臨被后來者強(qiáng)行超車的危險(xiǎn)。不過,R1的成功,也證明了“小力出奇跡”的可行性。在DeepSeek震動(dòng)全球AI圈后,巨頭青睞的“砸錢”與“小力出奇跡”的路線之爭仍在繼續(xù),遠(yuǎn)未分出勝負(fù)。
一
面對(duì)快速崛起的DeepSeek,美國科技巨頭表面上對(duì)其技術(shù)、產(chǎn)品和方法論贊嘆不已,但在戰(zhàn)略層面上,并沒有對(duì)其“小力出奇跡”的策略亦步亦趨。
恰恰相反, 在DeepSeek席卷全球AI大模型領(lǐng)域后,巨頭們的砸錢邁向了新高度。
以O(shè)penAI為例,奧特曼起初對(duì)于DeepSeek有所懷疑,稱“并不新穎,我們?cè)缫丫邆溥@一水平的模型”,且“被嚴(yán)重夸大了”。OpenAI甚至在1月底表示,DeepSeek涉嫌使用OpenAI專有模型訓(xùn)練自己的模型,違反了OpenAI的服務(wù)條款。
但在短短幾天后,奧特曼宣布沒有計(jì)劃起訴DeepSeek,同時(shí)稱贊“DeepSeek是一個(gè)令人印象深刻的模型”。在推出最新的o3-mini模型后,奧特曼甚至表示,在開源方面,OpenAI一直站在“錯(cuò)誤的一邊”。
DeepSeek大紅大紫,逼得奧特曼前倨后恭、低頭認(rèn)錯(cuò),此情此景讓不少人感到驚訝和振奮。但事實(shí)上,OpenAI無論是產(chǎn)品還是戰(zhàn)略,都沒有被DeepSeek這只“黑天鵝”所打亂。
1月底,OpenAI推出o3-mini,并首次向免費(fèi)用戶開放推理模型。測試表明,o3-mini相比上一代o1模型進(jìn)步極大,多項(xiàng)基準(zhǔn)測試表現(xiàn)優(yōu)異;特別是面對(duì)高難度的物理模擬項(xiàng)目——如球體碰撞等,展現(xiàn)出對(duì)于R1及其他模型的碾壓實(shí)力。
幾天后,OpenAI又以o3模型為基礎(chǔ)發(fā)布了Deep Research功能,號(hào)稱可以在幾十分鐘內(nèi)完成人類專家數(shù)小時(shí)的工作。在涵蓋超3000道問題的綜合測試“人類最后一場考試”中,Deep Research實(shí)現(xiàn)了26.6%的正確率,遠(yuǎn)超DeepSeek R1的9.4%。
o3-mini采用了許多與R1相同的技術(shù),比如強(qiáng)化學(xué)習(xí) (RL) 、稀疏化MoE、大量監(jiān)督微調(diào) (SFT) 等,最終成果也堪稱驚艷。然而,Open并沒有在研發(fā)范式上向DeepSeek靠攏,而是繼續(xù)沿著“氪金”的路線狂飆。
就在拿出o3-mini對(duì)陣DeepSeek R1的同時(shí),OpenAI高調(diào)宣布了5000億美元的“星際之門”計(jì)劃。該計(jì)劃將在全美國打造20座超算中心;首期將投資1000億美元,在得州建設(shè)10座數(shù)據(jù)中心。
盡管奧特曼的“一生之?dāng)场瘪R斯克火速趕來嘲諷,信誓旦旦地說“他們沒有錢”,但星際之門的進(jìn)展速度頗為驚人。計(jì)劃公開幾天后,奧特曼就曬出了“1號(hào)站點(diǎn)”的照片,稱之為“宏偉而美麗的建筑”。
盡管星際之門得到了軟銀和甲骨文的鼎力支持,且去年?duì)I收已經(jīng)高達(dá)37億美元,OpenAI仍在繼續(xù)儲(chǔ)備資金。
據(jù)報(bào)道, OpenAI正尋求以3400億美元估值融資400億美元,軟銀有望領(lǐng)投。 而在短短三個(gè)月前,OpenAI剛剛以1570億美元的估值,融到了66億美元。
奧特曼仿佛患上“資金短缺恐懼癥”,一邊瘋狂融資,一邊大手筆花錢。與之正面PK的其他科技巨頭,砸錢同樣毫不手軟。
今年,谷歌、微軟、Meta等均計(jì)劃投入數(shù)百億美元發(fā)展AI,力度之大遠(yuǎn)超華爾街預(yù)期。 以Meta為例,扎克伯格計(jì)劃斥資至少600億美元,建設(shè)一座擁有130萬塊GPU的AI數(shù)據(jù)中心。
作為對(duì)比,據(jù)科技咨詢公司Omdia測算,字節(jié)去年買了23萬塊GPU,且為性能較弱的英偉達(dá)特供版。即便如此,這一數(shù)字也遠(yuǎn)遠(yuǎn)超出了DeepSeek目前持有的芯片規(guī)模。
二
除了海外科技巨頭,國內(nèi)互聯(lián)網(wǎng)公司也在AI大模型領(lǐng)域投入巨資。DeepSeek的“小力出奇跡”,并沒有改寫這一局面。
一度在AI大模型領(lǐng)域落后的字節(jié),近兩年灑下重金。浙商證券在一份報(bào)告中稱,2024年字節(jié)資本開支約800億元,接近BAT的總和。
另有報(bào)道稱,字節(jié)2025年資本開支將超1500億,大部分用于AI。字節(jié)方面隨后否認(rèn)了這一說法。
此外,字節(jié)持續(xù)“掃貨”國內(nèi)AI領(lǐng)域的頂級(jí)人才。據(jù)“財(cái)經(jīng)天下”報(bào)道,字節(jié)某些AI方向的業(yè)務(wù)團(tuán)隊(duì)在招募知名院校的博士應(yīng)屆生時(shí),年薪可達(dá)兩三百萬元,遠(yuǎn)超其他大廠的100萬元左右。此外,張一鳴還親自從阿里等對(duì)手那里挖人。
除了研發(fā)費(fèi)用和人才成本,過去一兩年,字節(jié)在B端和C端同時(shí)為AI燒錢,力圖爭奪更多企業(yè)和個(gè)人用戶。
在B端,豆包大模型自去年5月發(fā)布之后不斷降價(jià),堪稱國內(nèi)AI大模型圈子的“價(jià)格屠夫”。據(jù)統(tǒng)計(jì),豆包文字大模型比行業(yè)便宜99.3%,去年12月發(fā)布的視覺理解模型比行業(yè)便宜85%。
同時(shí),在C端,豆包也在廣泛投流拉新。據(jù)AppGrowing統(tǒng)計(jì),去年4~5月,豆包投放金額預(yù)計(jì)為1500萬~1750萬元。6月上旬,豆包啟動(dòng)新一輪投放活動(dòng),投放金額高達(dá)1.24億元。
在猛砸資金后,豆包的用戶量猛增,成為國內(nèi)用戶最多的大模型應(yīng)用。
阿里同樣在AI大模型領(lǐng)域持續(xù)投入大筆資金。今年總臺(tái)春晚,阿里云成為云計(jì)算AI獨(dú)家合作伙伴。僅2024年上半年,阿里在AI基礎(chǔ)設(shè)施上的資本支出就達(dá)到230億元。此外,阿里花費(fèi)超百億元,投資AI創(chuàng)業(yè)公司“六小虎”。
騰訊方面,過去六年其研發(fā)總投入超2850億元,其中很大一部分投向了AI。而 在AI“六小虎”中,騰訊投資了其中五家。
僅就花錢力度而言,新BAT比不過谷歌、Meta、OpenAI,但依然是國內(nèi)AI大模型圈獨(dú)一檔的存在。相比之下,一直沒有融資的DeepSeek,仍然靠母公司幻方量化輸血;但國內(nèi)量化投資近年來處于行業(yè)谷底,DeepSeek能夠得到的資金支持恐怕不會(huì)很多。
不過,面對(duì)DeepSeek的強(qiáng)勢崛起,新BAT在繼續(xù)大手筆投錢的同時(shí),也試圖伸出橄欖枝、構(gòu)建“雙保險(xiǎn)”。
1月底、2月初,國內(nèi)主要云服務(wù)廠商均宣布接入DeepSeek大模型。阿里云宣布支持云上一鍵部署V3和R1,百度智能云、騰訊云、字節(jié)旗下火山引擎等也先后宣布了類似功能。
眾所周知,DeepSeek采用了最“慷慨”的開源協(xié)議,并不限制第三方對(duì)于自家開源模型的商用。阿里云等廠商第一時(shí)間接入DeepSeek大模型,能夠借著后者的潑天流量,為自己爭取一波關(guān)注度和新用戶。
另一方面,向DeepSeek伸出橄欖枝,也側(cè)面表明了大廠的心態(tài):即便DeepSeek與自家AI業(yè)務(wù)存在競爭,也不妨先為我所用,并從中獲得技術(shù)、產(chǎn)品等方面的啟發(fā)。這些主動(dòng)示好的舉動(dòng),也為雙方未來更大規(guī)模的合作留下了想象空間。
三
DeepSeek以“小力出奇跡”揚(yáng)名天下,但目前為止,這一頗為性感的新范式并未得到國內(nèi)外大廠的全面認(rèn)可與接納。砸錢、砸資源的“大力出奇跡”,依然是大廠參與AI大模型競爭的主要打法。
與此同時(shí),隨著競爭對(duì)手以新一代模型反擊,疊加自身規(guī)模擴(kuò)大導(dǎo)致的種種問題,DeepSeek正面臨被全面反超的危險(xiǎn)。
從產(chǎn)品上看,越來越多的用戶發(fā)覺,DeepSeek的大模型幻覺頻繁出現(xiàn)。無論是談?wù)搹腁到B的最佳路線,還是解析某一首歌曲,或分析某一專業(yè)話題, DeepSeek都存在較為嚴(yán)重的“一本正經(jīng)地胡說八道”問題。
大模型的幻覺問題一直廣泛存在,也是整個(gè)AI圈子始終未能克服的難題。DeepSeek在這方面并沒有展現(xiàn)比其他模型更出色的性能,這折射出 僅靠大模型工程層面的創(chuàng)新,并不足以攻克更基礎(chǔ)的AI難題。
另一方面,短時(shí)間內(nèi)瘋狂涌入的全球用戶,也讓DeepSeek有些力不從心。
據(jù)統(tǒng)計(jì),DeepSeek自上線各大應(yīng)用商店以來,短期內(nèi)獲得1600萬次下載,登頂140個(gè)應(yīng)用市場,最高日活躍用戶突破2200萬。由于用戶太多,DeepSeek的深度思考和聯(lián)網(wǎng)搜索功能一度暫時(shí)停止服務(wù)。
這也表明,“小力出奇跡”或許可以大幅節(jié)約模型訓(xùn)練的成本,但在模型投入使用后,必要的基礎(chǔ)設(shè)施成本仍然無法壓減。
從商業(yè)角度來看, AI大模型注定是一門規(guī)模越大、能力越強(qiáng)、成本越高的生意。 巨頭們堅(jiān)守“尺度定律”,其根基——算力、算法和數(shù)據(jù)三角模型依然穩(wěn)固。
在DeepSeek崛起的過程中,一個(gè)被不少人忽視的問題是,R1的推理性能與o1不相上下,但在許多基準(zhǔn)測試中不如o1。而箭在弦上的o3“滿血版”,綜合性能遠(yuǎn)超o1。和同期其他對(duì)手相比,比如谷歌的Gemini 2.0 Flash,R1也并非全面領(lǐng)先,而是與對(duì)手各擅勝場。
在專業(yè)人士眼中,R1的真正價(jià)值是,通過多種技術(shù)創(chuàng)新——比如強(qiáng)化學(xué)習(xí)、GRPO算法框架、DeepSeek MOE等,再加上優(yōu)秀的工程思想,以較低成本在部分指標(biāo)接近或超越了行業(yè)最強(qiáng)大模型。DeepSeek的“小力出奇跡”固然驚艷,但從來不是性能最強(qiáng)的大模型。
OpenAI剛發(fā)布的o3-mini,在許多測試中已經(jīng)反超R1,也讓國外巨頭繼續(xù)狂砸錢有了更堅(jiān)實(shí)的證明。這表明,除了優(yōu)秀的人才、出色的算法外,強(qiáng)大的算力、豐富的數(shù)據(jù),也是構(gòu)建更強(qiáng)大模型,乃至通往AGI的必經(jīng)之路。
DeepSeek“小力出奇跡”證明了AI大模型的另一條發(fā)展路徑,卻并非唯一的路徑。手握重金的科技巨頭,依然是AI大模型的主要參與者,同時(shí)也是DeepSeek繼續(xù)上攻的強(qiáng)大對(duì)手。
AI大模型遠(yuǎn)未分出勝負(fù) ,DeepSeek及其擁躉不能“半場開香檳”。而高性價(jià)比路線與“大力出奇跡”路線之爭,也仍將持續(xù)下去,并在互相借鑒和融合中,推動(dòng)AI大模型邁向下一個(gè)發(fā)展階段。
參考資料:
APPSO,《萬字揭秘DeepSeek:頂尖AI人才年薪千萬,訓(xùn)練成本被低估》
亂彈山,《我確實(shí)低估了DeepSeek所引發(fā)的大面積“AI幻覺”》
億歐網(wǎng),《特朗普孫正義組局,預(yù)砸5000億美金建“星際之門”》
IT之家,《Meta宣布將打造擁有 130 萬顆 GPU 的 AI 數(shù)據(jù)中心》
新智元,《o3-mini物理推理粉碎DeepSeek R1,OpenAI王者歸來!全網(wǎng)最全實(shí)測》
本文來自微信公眾號(hào): 字母榜 ,作者:彥飛,編輯:王靖