AI時代的端、體裁和商業模式
一
我們處在一個有趣的歷史節點上:新的技術 (AI) 已經出現,但是新的端 (電腦/手機/耳機/手表/眼鏡……) 尚未出現。
過去30年有兩個大的浪潮:一個是PC互聯網 (1995-2009) ,一個是移動互聯網 (2010-2020) 。有趣的是,“端”都出現在了時代的命名里,這符合考古學用生產工具來命名一個時代的做法,如石器時代/鐵器時代。1000年后,人們挖出來的大概率是電腦和手機,而不是無形的互聯網技術。
技術是重要的。有人叫即將到來的時代“AI時代”,用技術來命名一個時代符合慣例,與用互聯網技術來命名“互聯網時代”是一樣的。
但是,在技術之下,端同樣是重要的。互聯網技術從1969年的阿帕網就有了,但是端卻局限為大學和軍隊的大型電腦。一直等到1990年代,互聯網技術與逐漸開始普及的PC機結合,互聯網才真正成為一個時代。
站在2025年,我們發現一個最大的問題:ChatGPT等新應用,基本還是長在原來的端——電腦和手機上。
Meta在2021年探索了智能眼鏡,字節在2024年探索了智能耳機。再早很多年 (2015年) ,出門問問探索過智能手表 (Apple Watch的智能做得不好是非常可惜的) 。但截至目前,這些都還沒能成為足夠普及的新的端。
我認為:新的端的出現才是進入一個新的時代的標志,因此,我不覺得我們已經進入了AI時代。
二
Chat是AI時代的新體裁。從歷史看,體裁會先于端出現。人們對新體裁的采納,導致生產工具用進廢退,從而推動了新端取代舊端。
把Chat視作一種內容體裁,與長視頻、圖文、短視頻、直播等等體裁放在一起討論,好像還沒什么人這么做過。
所謂體裁,用另外的話說是內容的形式。我之所以更喜歡用體裁這個詞,是因為它更好地暗示了形式對內容的限制性,他就像一個人的外殼,限制了人但也定義了人。
即時通信比如QQ、YY、微信 (WeChat) 在互聯網時代就一直存在。但是即時通信一直無法成為一種內容體裁,而只是工具。原因是:內容的背后是創作者。在即時通信里,人與人是等價的,不存在創作者和用戶。
直播連麥已經是Chat的雛形,但是在沒有AI的情況下,這種一對一的形式規模做不大。如果一對多那就屬于直播、而不算Chat了。
大模型使規模化Chat成為可能。按理來說,大模型可以應用于一切領域,但是值得想一下,為什么ChatGPT是大模型第一個跑出來的App?因為Chat這種體裁對大模型技術的應用最純粹,不是大模型+。就像在互聯網時代跑出來的真正大公司,都是做信息分發的,這是對互聯網技術最純粹的應用,而不是做互聯網+的公司 (例如貝殼) 。
應用及其體裁先于端出現,這種情況在歷史上并不少見。可適應移動互聯網的產品人人網 (校內網) 2005年上線,新浪微博2009年上線,知乎2010年上線。與后來的今日頭條、抖音不同,他們都不是移動原生公司,而是一開始從做PC網頁開始的。
人人網的狀態/日志、140字微博、問答這些新體裁的出現,搶占了用戶時長。我2010年剛上大一的時候,在PC上主要消費長視頻、博客、BBS帖子等內容,后來大量時間就在水人人、微博、知乎了 (尤其是人人) 。
工具是用進廢退的,此時我對端的屏幕大小、信息處理速度等要求其實都下降了。水人人、知乎,用手機足夠了。因此,對我而言,體裁的遷移,促進了端的遷移。
林軍《沸騰新十年》里提到,新浪網前總編輯陳彤曾告訴他,微博是移動互聯網時代的第一個產品。有早期的蘋果粉去香港買iPhone,發現蘋果手機都被搶光了,說是都被玩新浪微博的人買走了。
從這段簡短的論述中我解讀出2個信息:一是新的時代的第一個應用可能會是雙棲的,而不是新端原生的,甚至一開始會主要在老端上,二是新的應用,會刺激人們購買新的端。
以此推演,ChatGPT很可能成為類似微博的存在——AI時代的第一個產品,但是并不是新端原生的,而是一開始主要在電腦和手機這樣的老端上使用,但是等到ChatGPT占據人們足夠的時長后,人們突然發現,如果絕大多數時間都是以語音的形式與ChatGPT對話,自己好像也不需要手機屏幕了,更貼身的手表和耳機可能是更好的選擇。于是人們開始大量購買手表和耳機,接下來,手表和耳機的原生應用會出現,會用到新的端獨有的傳感器 (就像微信搖一搖用到了手機的陀螺儀) 。
順便說一句,這里我投手表一票。手表與人足夠近,可以成為我們身體的一部分,同時異物感又沒有那么重。
三
體裁很重要,因為體裁決定了商業模式。
每個時代都有每個時代的體裁。PC互聯網時代的體裁是長視頻、博客、BBS帖子等。移動互聯網時代的體裁是微博圖文、短視頻、直播。AI時代的體裁則是Chat。
這里順便說一下,我認為百度之所以在移動互聯網時代掉隊,不是因為百度本身產品形態不適合移動互聯網,相反,一個搜索框的產品形態是最適合移動端的。核心問題是,人們使用百度搜索,搜索出來的結果的內容體裁是什么,這些體裁是否適應移動端。根據中國互聯網絡信息中心《2011年中國搜索引擎用戶行為研究報告》,用戶使用搜索引擎主要的搜索內容前5名是新聞、視頻、音樂、學術資料、小說。因為百度只做信息分發,很長時間沒有自己做內容 (2016年百家號才上線) ,而用戶搜索的前幾名內容體裁,都不一定適用移動端。這可能才是百度在移動互聯網時代掉隊的根本原因。啟示是進入新時代一定不要只做分發,要參與到新體裁的定義中,并盡早切入創作者生態。
如果我們把各種體裁,按是不是自然語言的程度排布,最左邊應該是學術資料 (表格、PPT、專業書籍) 、然后可能是小說 (我已經很久沒看小說了,讀小說樂趣挺高,但是需要的腦力投入太大) 、長視頻 (我在電腦上看電影的一般做法都是暫停,理解一會兒,然后繼續,看電影至今對我來說都是一件太燒腦的事) ,然后依次是博客長文、BBS帖子、微博圖文、短視頻和直播。短視頻的親民程度是驚人的,也是截至目前用戶規模最大的內容體裁 (抖音有7億日活,微信雖然10億日活,但是如果只算消費內容的人,用戶應該沒有抖音多) 。而直播,則可以說是最易于一般人類理解的內容體裁了。這里出于適應Chat這個新體裁的旨趣,部分也出于懶惰,我就不畫圖了,請大家自行腦補,進行文生圖。
這個光譜越往左,信息密度越高,對腦力的耗費越高,潛在用戶規模越小。越往右,信息密度越低,對腦力耗費越小,潛在用戶規模越大。
Chat是最自然語言的,理論上講潛在用戶規模是最大的。所以,像Kimi那樣致力于生成專業內容、目標用戶定位很高的路徑很可能是錯誤的。而像豆包那樣回復較短內容,且致力于做語音對話、視頻通話等更貼近人類的功能,做下沉用戶的路徑,可能是正確的。理論上講,豆包應該可以覆蓋掉抖音都玩不明白的人,日活規模上限是14億。
商業模式就是給目標用戶提供了什么價值,通過什么方式變現的問題。這之間往往存在取舍:是為少數人提供重度服務,還是為多數人提供沒那么重度的服務?
Chat雖然目標用戶規模更大,但不一定適合提供重度服務。以電商為例,目前多數電商平臺的PC端的客單價還是高于移動端,這是因為當人們需要做出裝修、購買大家電等重度決策的時候,仍然會在PC端查閱資料,進行詳細的比較。但如果從GMV占比看,還是移動端占比高,因為移動端可以足夠覆蓋所有不需要重度決策的購物,而且這些購物雖然客單價低,但是是更高頻的,所以總消費金額反而更高。
以此推演,未來的電商盤子分配可能是:Chat搶占了更低決策需求、更高頻的部分:比如每天買菜,其實就是補貨,可能不需要什么挑選,口頭告訴AI語音助手一聲要買什么就行了;此外還有買標品的場景,比如充話費、買火車票,也不需要決策什么,AI直接幫我們買了就行。還有一種情況:人們在決策的時候因為選擇太多而陷入選擇困難癥,其實多數人沒有那么追求決策的完美,差不多滿意就行,如果這個決策是可逆的 (比如可以退貨) ,與其費腦力選擇,不如把選擇權交給豆包。當豆包掌握更多數據,也可以做推薦,在對話框彈出一個信息,給我推薦商品,體驗可能類似社交電商,電商可能就是一個我們在豆包加的人。
四
豆包這個產品的形態,目前已經無限接近微信。我認為,字節甚至有通過豆包做一個AI時代的微信機會。
我們現在在豆包上會加一些虛擬的人,比如我就加了很多個馬保國,他們還會經常問我:年輕人,最近怎么不找我聊天了?這些都是創作者創作的智能體。豆包為什么不可以同時集成真人?未來,真人和虛擬人完全可以同時出現在我的豆包通訊錄里,微信會被我舍棄。
目前打開豆包,界面雖然類似微信,但是有一個區別,當我發起一個新對話的時候,每個新的對話都會單獨占據一行,雖然我能理解這么做可能是為了保存每段對話,方便查閱,但是此時在我的感知里,我豆包里加的是一個一個人的感覺被破壞掉了。我建議豆包用某種辦法把這些跟豆包主體發生的對話都折疊到豆包這個人的下面。跟其他用戶創作的虛擬人的對話繼續依次排列在下方。
AI時代的創作者,不再是直接生產內容的人,而是一個不斷設定、調試智能體的人。可以暢想,擁有人物角色定義能力的小說家,可能成為AI時代Chat這個體裁最出彩的創作者。
本文來自微信公眾號: 底層觀察家 ,作者:程春曉