DeepSeek勸不了谷歌們

虎嗅網(wǎng) ? 6月前掃碼分享

我是創(chuàng)始人李巖：很抱歉！給自己產(chǎn)品做個(gè)廣告，點(diǎn)擊進(jìn)來看看。

過去一個(gè)月，DeepSeek以大約十分之一的訓(xùn)練成本，推出與OpenAI o1性能接近的開源模型R1， “小力出奇跡”的新范式震撼全球AI大模型行業(yè)。 同時(shí)，外界對(duì)于大型科技公司動(dòng)輒數(shù)百億美元的AI研發(fā)開支，也產(chǎn)生了越來越多的質(zhì)疑。

但被“DeepSeek沖擊”嚇了一跳的科技巨頭，并沒有因此改弦更張。相反，他們正揮舞著支票簿，試圖 靠瘋狂砸錢，重新奪取AI大模型的制高點(diǎn)。

2月5日，谷歌母公司Alphabet發(fā)布2024年第四季度財(cái)報(bào)，營收和凈利潤均實(shí)現(xiàn)兩位數(shù)百分比的同比增長。引人注目的是，Alphabet宣布，2025財(cái)年的資本支出將達(dá)到750億美元（約合人民幣5454億元），以繼續(xù)擴(kuò)展其人工智能戰(zhàn)略。

一年投入750個(gè)“小目標(biāo)”研發(fā)AI，遠(yuǎn)遠(yuǎn)超出了華爾街599.4億美元的預(yù)期。不過，谷歌有實(shí)力如此燒錢：截至去年底，它持有現(xiàn)金、現(xiàn)金等價(jià)物及有價(jià)證券約957億美元。

稍早時(shí)候，谷歌還向AI明星創(chuàng)業(yè)公司Anthropic追加投資10億美元。2023年至今，谷歌向這家公司累計(jì)投資35.5億美元。

財(cái)大氣粗的谷歌投身AI燒錢競賽，其他科技巨頭也不遑多讓。

今年1月初，微軟宣布將于2025財(cái)年投資800億美元，建設(shè)AI數(shù)據(jù)中心。這筆投資創(chuàng)下了微軟成立以來的單筆投資最高紀(jì)錄。而在上一財(cái)年，微軟的資本支出超500億美元，大部分用于AI相關(guān)的基礎(chǔ)設(shè)施。

社交網(wǎng)絡(luò)巨頭Meta在1月底宣布，公司將在今年投資600億~650億美元，并大幅擴(kuò)張AI團(tuán)隊(duì)，以期實(shí)現(xiàn)Meta AI服務(wù)10億人、Llama 4成為行業(yè)領(lǐng)先大模型的目標(biāo)。Meta創(chuàng)始人扎克伯格稱， 今年將是“AI決定性的一年”。

OpenAI則拉上軟銀、甲骨文、微軟、ARM、英偉達(dá)以及中東人工智能基金（MGX）等產(chǎn)業(yè)和投資巨頭，預(yù)計(jì)投資5000億美元，聯(lián)手成立“星際之門”，這些資金將被用于數(shù)據(jù)中心等AI基礎(chǔ)設(shè)施的建設(shè)與運(yùn)營。

相比之下，國內(nèi)科技巨頭面向AI大模型的砸錢規(guī)模小了一個(gè)數(shù)量級(jí)，但也動(dòng)輒數(shù)百億元，且增長很快。

根據(jù)財(cái)報(bào)等公開信息，2024年前三季度，百度、阿里、騰訊的總資本開支約為人民幣867億元。金融數(shù)據(jù)服務(wù)商Visible Alpha預(yù)計(jì)，到2027年，BAT的資本支出將達(dá)到1767億元，年復(fù)合增長率超26%。考慮到BAT的重視程度， 這些資本開支將有很大一部分流向AI大模型。

不難看出，科技巨頭發(fā)展AI大模型，砸錢仍然是基本武器之一。盡管DeepSeek證明了“小力出奇跡”的可行性，但巨頭們出于多種原因，仍然沿著“大力出奇跡”的路線前行。

這并非僅僅是大公司的慣性使然。OpenAI剛剛發(fā)布的o3-mini，已經(jīng)在物理推理等多項(xiàng)指標(biāo)上反超R1，而更強(qiáng)大的o3標(biāo)準(zhǔn)版也已經(jīng)箭在弦上。這也再次證明， “尺度定律”仍然是AI大模型的基本規(guī)則之一，而“小力出奇跡”并非置之四海而皆準(zhǔn)。

尚未找到“金主爸爸”的DeepSeek，在算力、數(shù)據(jù)、資金和資源方面比不上巨頭，正面臨被后來者強(qiáng)行超車的危險(xiǎn)。不過，R1的成功，也證明了“小力出奇跡”的可行性。在DeepSeek震動(dòng)全球AI圈后，巨頭青睞的“砸錢”與“小力出奇跡”的路線之爭仍在繼續(xù)，遠(yuǎn)未分出勝負(fù)。

一

面對(duì)快速崛起的DeepSeek，美國科技巨頭表面上對(duì)其技術(shù)、產(chǎn)品和方法論贊嘆不已，但在戰(zhàn)略層面上，并沒有對(duì)其“小力出奇跡”的策略亦步亦趨。

恰恰相反， 在DeepSeek席卷全球AI大模型領(lǐng)域后，巨頭們的砸錢邁向了新高度。

以O(shè)penAI為例，奧特曼起初對(duì)于DeepSeek有所懷疑，稱“并不新穎，我們?cè)缫丫邆溥@一水平的模型”，且“被嚴(yán)重夸大了”。OpenAI甚至在1月底表示，DeepSeek涉嫌使用OpenAI專有模型訓(xùn)練自己的模型，違反了OpenAI的服務(wù)條款。

但在短短幾天后，奧特曼宣布沒有計(jì)劃起訴DeepSeek，同時(shí)稱贊“DeepSeek是一個(gè)令人印象深刻的模型”。在推出最新的o3-mini模型后，奧特曼甚至表示，在開源方面，OpenAI一直站在“錯(cuò)誤的一邊”。

DeepSeek大紅大紫，逼得奧特曼前倨后恭、低頭認(rèn)錯(cuò)，此情此景讓不少人感到驚訝和振奮。但事實(shí)上，OpenAI無論是產(chǎn)品還是戰(zhàn)略，都沒有被DeepSeek這只“黑天鵝”所打亂。

1月底，OpenAI推出o3-mini，并首次向免費(fèi)用戶開放推理模型。測試表明，o3-mini相比上一代o1模型進(jìn)步極大，多項(xiàng)基準(zhǔn)測試表現(xiàn)優(yōu)異；特別是面對(duì)高難度的物理模擬項(xiàng)目——如球體碰撞等，展現(xiàn)出對(duì)于R1及其他模型的碾壓實(shí)力。

幾天后，OpenAI又以o3模型為基礎(chǔ)發(fā)布了Deep Research功能，號(hào)稱可以在幾十分鐘內(nèi)完成人類專家數(shù)小時(shí)的工作。在涵蓋超3000道問題的綜合測試“人類最后一場考試”中，Deep Research實(shí)現(xiàn)了26.6%的正確率，遠(yuǎn)超DeepSeek R1的9.4%。

o3-mini采用了許多與R1相同的技術(shù)，比如強(qiáng)化學(xué)習(xí) （RL）、稀疏化MoE、大量監(jiān)督微調(diào) （SFT）等，最終成果也堪稱驚艷。然而，Open并沒有在研發(fā)范式上向DeepSeek靠攏，而是繼續(xù)沿著“氪金”的路線狂飆。

就在拿出o3-mini對(duì)陣DeepSeek R1的同時(shí)，OpenAI高調(diào)宣布了5000億美元的“星際之門”計(jì)劃。該計(jì)劃將在全美國打造20座超算中心；首期將投資1000億美元，在得州建設(shè)10座數(shù)據(jù)中心。

盡管奧特曼的“一生之?dāng)场瘪R斯克火速趕來嘲諷，信誓旦旦地說“他們沒有錢”，但星際之門的進(jìn)展速度頗為驚人。計(jì)劃公開幾天后，奧特曼就曬出了“1號(hào)站點(diǎn)”的照片，稱之為“宏偉而美麗的建筑”。

盡管星際之門得到了軟銀和甲骨文的鼎力支持，且去年?duì)I收已經(jīng)高達(dá)37億美元，OpenAI仍在繼續(xù)儲(chǔ)備資金。

據(jù)報(bào)道， OpenAI正尋求以3400億美元估值融資400億美元，軟銀有望領(lǐng)投。 而在短短三個(gè)月前，OpenAI剛剛以1570億美元的估值，融到了66億美元。

奧特曼仿佛患上“資金短缺恐懼癥”，一邊瘋狂融資，一邊大手筆花錢。與之正面PK的其他科技巨頭，砸錢同樣毫不手軟。

今年，谷歌、微軟、Meta等均計(jì)劃投入數(shù)百億美元發(fā)展AI，力度之大遠(yuǎn)超華爾街預(yù)期。 以Meta為例，扎克伯格計(jì)劃斥資至少600億美元，建設(shè)一座擁有130萬塊GPU的AI數(shù)據(jù)中心。

作為對(duì)比，據(jù)科技咨詢公司Omdia測算，字節(jié)去年買了23萬塊GPU，且為性能較弱的英偉達(dá)特供版。即便如此，這一數(shù)字也遠(yuǎn)遠(yuǎn)超出了DeepSeek目前持有的芯片規(guī)模。

二

除了海外科技巨頭，國內(nèi)互聯(lián)網(wǎng)公司也在AI大模型領(lǐng)域投入巨資。DeepSeek的“小力出奇跡”，并沒有改寫這一局面。

一度在AI大模型領(lǐng)域落后的字節(jié)，近兩年灑下重金。浙商證券在一份報(bào)告中稱，2024年字節(jié)資本開支約800億元，接近BAT的總和。

另有報(bào)道稱，字節(jié)2025年資本開支將超1500億，大部分用于AI。字節(jié)方面隨后否認(rèn)了這一說法。

此外，字節(jié)持續(xù)“掃貨”國內(nèi)AI領(lǐng)域的頂級(jí)人才。據(jù)“財(cái)經(jīng)天下”報(bào)道，字節(jié)某些AI方向的業(yè)務(wù)團(tuán)隊(duì)在招募知名院校的博士應(yīng)屆生時(shí)，年薪可達(dá)兩三百萬元，遠(yuǎn)超其他大廠的100萬元左右。此外，張一鳴還親自從阿里等對(duì)手那里挖人。

除了研發(fā)費(fèi)用和人才成本，過去一兩年，字節(jié)在B端和C端同時(shí)為AI燒錢，力圖爭奪更多企業(yè)和個(gè)人用戶。

在B端，豆包大模型自去年5月發(fā)布之后不斷降價(jià)，堪稱國內(nèi)AI大模型圈子的“價(jià)格屠夫”。據(jù)統(tǒng)計(jì)，豆包文字大模型比行業(yè)便宜99.3%，去年12月發(fā)布的視覺理解模型比行業(yè)便宜85%。

同時(shí)，在C端，豆包也在廣泛投流拉新。據(jù)AppGrowing統(tǒng)計(jì)，去年4~5月，豆包投放金額預(yù)計(jì)為1500萬~1750萬元。6月上旬，豆包啟動(dòng)新一輪投放活動(dòng)，投放金額高達(dá)1.24億元。

在猛砸資金后，豆包的用戶量猛增，成為國內(nèi)用戶最多的大模型應(yīng)用。

阿里同樣在AI大模型領(lǐng)域持續(xù)投入大筆資金。今年總臺(tái)春晚，阿里云成為云計(jì)算AI獨(dú)家合作伙伴。僅2024年上半年，阿里在AI基礎(chǔ)設(shè)施上的資本支出就達(dá)到230億元。此外，阿里花費(fèi)超百億元，投資AI創(chuàng)業(yè)公司“六小虎”。

騰訊方面，過去六年其研發(fā)總投入超2850億元，其中很大一部分投向了AI。而 在AI“六小虎”中，騰訊投資了其中五家。

僅就花錢力度而言，新BAT比不過谷歌、Meta、OpenAI，但依然是國內(nèi)AI大模型圈獨(dú)一檔的存在。相比之下，一直沒有融資的DeepSeek，仍然靠母公司幻方量化輸血；但國內(nèi)量化投資近年來處于行業(yè)谷底，DeepSeek能夠得到的資金支持恐怕不會(huì)很多。

不過，面對(duì)DeepSeek的強(qiáng)勢崛起，新BAT在繼續(xù)大手筆投錢的同時(shí)，也試圖伸出橄欖枝、構(gòu)建“雙保險(xiǎn)”。

1月底、2月初，國內(nèi)主要云服務(wù)廠商均宣布接入DeepSeek大模型。阿里云宣布支持云上一鍵部署V3和R1，百度智能云、騰訊云、字節(jié)旗下火山引擎等也先后宣布了類似功能。

眾所周知，DeepSeek采用了最“慷慨”的開源協(xié)議，并不限制第三方對(duì)于自家開源模型的商用。阿里云等廠商第一時(shí)間接入DeepSeek大模型，能夠借著后者的潑天流量，為自己爭取一波關(guān)注度和新用戶。

另一方面，向DeepSeek伸出橄欖枝，也側(cè)面表明了大廠的心態(tài)：即便DeepSeek與自家AI業(yè)務(wù)存在競爭，也不妨先為我所用，并從中獲得技術(shù)、產(chǎn)品等方面的啟發(fā)。這些主動(dòng)示好的舉動(dòng)，也為雙方未來更大規(guī)模的合作留下了想象空間。

三

DeepSeek以“小力出奇跡”揚(yáng)名天下，但目前為止，這一頗為性感的新范式并未得到國內(nèi)外大廠的全面認(rèn)可與接納。砸錢、砸資源的“大力出奇跡”，依然是大廠參與AI大模型競爭的主要打法。

與此同時(shí)，隨著競爭對(duì)手以新一代模型反擊，疊加自身規(guī)模擴(kuò)大導(dǎo)致的種種問題，DeepSeek正面臨被全面反超的危險(xiǎn)。

從產(chǎn)品上看，越來越多的用戶發(fā)覺，DeepSeek的大模型幻覺頻繁出現(xiàn)。無論是談?wù)搹腁到B的最佳路線，還是解析某一首歌曲，或分析某一專業(yè)話題， DeepSeek都存在較為嚴(yán)重的“一本正經(jīng)地胡說八道”問題。

大模型的幻覺問題一直廣泛存在，也是整個(gè)AI圈子始終未能克服的難題。DeepSeek在這方面并沒有展現(xiàn)比其他模型更出色的性能，這折射出 僅靠大模型工程層面的創(chuàng)新，并不足以攻克更基礎(chǔ)的AI難題。

另一方面，短時(shí)間內(nèi)瘋狂涌入的全球用戶，也讓DeepSeek有些力不從心。

據(jù)統(tǒng)計(jì)，DeepSeek自上線各大應(yīng)用商店以來，短期內(nèi)獲得1600萬次下載，登頂140個(gè)應(yīng)用市場，最高日活躍用戶突破2200萬。由于用戶太多，DeepSeek的深度思考和聯(lián)網(wǎng)搜索功能一度暫時(shí)停止服務(wù)。

這也表明，“小力出奇跡”或許可以大幅節(jié)約模型訓(xùn)練的成本，但在模型投入使用后，必要的基礎(chǔ)設(shè)施成本仍然無法壓減。

從商業(yè)角度來看， AI大模型注定是一門規(guī)模越大、能力越強(qiáng)、成本越高的生意。 巨頭們堅(jiān)守“尺度定律”，其根基——算力、算法和數(shù)據(jù)三角模型依然穩(wěn)固。

在DeepSeek崛起的過程中，一個(gè)被不少人忽視的問題是，R1的推理性能與o1不相上下，但在許多基準(zhǔn)測試中不如o1。而箭在弦上的o3“滿血版”，綜合性能遠(yuǎn)超o1。和同期其他對(duì)手相比，比如谷歌的Gemini 2.0 Flash，R1也并非全面領(lǐng)先，而是與對(duì)手各擅勝場。

在專業(yè)人士眼中，R1的真正價(jià)值是，通過多種技術(shù)創(chuàng)新——比如強(qiáng)化學(xué)習(xí)、GRPO算法框架、DeepSeek MOE等，再加上優(yōu)秀的工程思想，以較低成本在部分指標(biāo)接近或超越了行業(yè)最強(qiáng)大模型。DeepSeek的“小力出奇跡”固然驚艷，但從來不是性能最強(qiáng)的大模型。

OpenAI剛發(fā)布的o3-mini，在許多測試中已經(jīng)反超R1，也讓國外巨頭繼續(xù)狂砸錢有了更堅(jiān)實(shí)的證明。這表明，除了優(yōu)秀的人才、出色的算法外，強(qiáng)大的算力、豐富的數(shù)據(jù)，也是構(gòu)建更強(qiáng)大模型，乃至通往AGI的必經(jīng)之路。

DeepSeek“小力出奇跡”證明了AI大模型的另一條發(fā)展路徑，卻并非唯一的路徑。手握重金的科技巨頭，依然是AI大模型的主要參與者，同時(shí)也是DeepSeek繼續(xù)上攻的強(qiáng)大對(duì)手。

AI大模型遠(yuǎn)未分出勝負(fù) ，DeepSeek及其擁躉不能“半場開香檳”。而高性價(jià)比路線與“大力出奇跡”路線之爭，也仍將持續(xù)下去，并在互相借鑒和融合中，推動(dòng)AI大模型邁向下一個(gè)發(fā)展階段。

參考資料：

APPSO，《萬字揭秘DeepSeek：頂尖AI人才年薪千萬，訓(xùn)練成本被低估》

亂彈山，《我確實(shí)低估了DeepSeek所引發(fā)的大面積“AI幻覺”》

億歐網(wǎng)，《特朗普孫正義組局，預(yù)砸5000億美金建“星際之門”》

IT之家，《Meta宣布將打造擁有 130 萬顆 GPU 的 AI 數(shù)據(jù)中心》

新智元，《o3-mini物理推理粉碎DeepSeek R1，OpenAI王者歸來！全網(wǎng)最全實(shí)測》

本文來自微信公眾號(hào)：字母榜，作者：彥飛，編輯：王靖