維他動力Vbot:當(dāng)遙控器被丟掉,才是機器狗「有生命感」的第一步?
?
頭圖來源:維他動力
?
?
8 月 8 日下午,北京亦莊的世界機器人大會A區(qū)一角,人潮涌動間隙,可以看到一只溜達(dá)的「小短腿」。
?
它一會兒跟在展區(qū)人員身后走來走去,一會兒又?jǐn)D進(jìn)人群對著鏡頭歪頭賣萌——這是在WAIC后,維他動力(Vbot)又一次把自家「大頭」放到真實人流里「溜達(dá)」。
?
如果機器人終究要走進(jìn)家里的客廳,它應(yīng)該長什么樣?該用什么姿態(tài)和你的孩子打招呼?又憑什么讓家里人相信,它是一個可以放心的家庭成員?
?
這家成立剛滿半年的公司,帶著 3 億元融資、60 多位從 AI、汽車、動畫乃至飛機內(nèi)飾領(lǐng)域跨界而來的工程師與設(shè)計師,試圖回答以上問題。他們給出的答案,就是這只昵稱為「大頭」的智能伴隨機器人Vbot。
?
聯(lián)合創(chuàng)始人趙哲倫說,他們在試圖用「工程科學(xué)的思維控制精度,用藝術(shù)的思維創(chuàng)造靈魂」 ,為機器人注入「生命力」。
?
他們想讓四足機器人擺脫遙控器,同時回答一個問題:機器人到底能怎樣進(jìn)入真實的家庭生活?
?
「賽博遛狗」|圖片來源:維他動力
?
跳出「工具論」,重新定義機器人的「存在感」
?
「大頭」不是人們印象中那種帶著工業(yè)氣息、充滿機械感的機器狗,也不是過于擬人以至于有些怪異的仿生體,而是一款外觀圓潤、充滿親和力的四足機器人,定位是「智能伴隨機器人」 。
?
「我們認(rèn)為它在正式交付之后會是你的小跟班、小跟拍、小跟護?!?趙哲倫這樣描述產(chǎn)品的核心體驗:它可以跟隨家庭的每一個成員出行,幫著拿包;利用AI能力,成為比家人更懂抓拍時機的攝影師;甚至可以在你無暇他顧時,照看老人和孩子 。
「大頭」表演了一段跳舞|視頻來源:極客公園
?
這聽起來像是一個不錯的家庭伙伴,但一個問題是:為什么是現(xiàn)在?為什么是四足形態(tài)?畢竟,在過去十多年里,至少有三代四足機器人問世,但它們似乎從未真正走出實驗室,進(jìn)入大眾的視野 。
?
維他動力創(chuàng)始人余軼南(前地平線智能駕駛總裁,自 2015 年起主導(dǎo)地平線智能駕駛和智能座艙技術(shù)研發(fā)與落地)的看法是,「過去的產(chǎn)品為什么不work?核心就是幾點:第一是價值交付,第二是成本,第三點是非常重要的,面向消費者的售后維護?!?他提到,過去的機器人成本高達(dá)幾十萬,且在安全性、可靠性上難以保證,本質(zhì)上是技術(shù)發(fā)展還未到那個階段 。
?
而今天,情況發(fā)生了質(zhì)的改變。維他動力聯(lián)合創(chuàng)始人趙哲倫(前理想汽車智能駕駛產(chǎn)品總監(jiān),負(fù)責(zé)理想 ONE 與 L 系列車型智能駕駛產(chǎn)品的定義與交付)將其歸功于一個「盟友」——智能汽車產(chǎn)業(yè)?!刚麄€智能駕駛,它確實是很好地開拓了整個機器人發(fā)展的前提?!?/p>
?
他解釋道,智能汽車的快速發(fā)展,使得無論是算力芯片、控制器還是電機,其成本在中國被大幅優(yōu)化,并且品質(zhì)極高,這為當(dāng)今的機器人制造提供了絕佳的基礎(chǔ) 。
?
有了「造得起」的前提,下一個問題便是「如何設(shè)計」。
?
維他動力從一開始就希望跳出傳統(tǒng)機器人設(shè)計的窠臼。趙哲倫分享了他們最初的產(chǎn)品定義思考:在一個矩陣的兩軸上,一條是機器人與人的關(guān)系,從工業(yè)、冷峻到友善,再到可能過于「低幼化」的玩具感;另一條則是它的行動能力,從桌面級、室內(nèi)輪式,到能夠戶外行走但無法上下臺階,再到真正的全地形能力 。
?
「我們最早的時候其實希望這個機器人盡可能小,但我發(fā)現(xiàn)要想基礎(chǔ)地完成跟人一樣走,人能到哪它能到哪,全地形能力,腿的長度至少得是現(xiàn)在這個長度。」
?
最終,他們將Vbot定義在「友善」與「全地形能力」的交點上:它要有足夠強的運動能力,但外觀上又不能帶有攻擊性,而是友善、可愛,同時又不失質(zhì)感,不會讓人覺得是個玩具 。
?
為此,團隊引入了「迪特-拉姆斯式簡約設(shè)計」,遵循「Less, but Better」的核心理念 。他們的首席工業(yè)設(shè)計師曾有十幾年在美國設(shè)計商務(wù)艙內(nèi)飾的經(jīng)驗,為Vbot帶來審美上的質(zhì)感 。趙哲倫總結(jié)了四個設(shè)計原則:
?
- 黃金比例 :無論是大小腿的比例,還是身體與頭部的對比,都經(jīng)過精心計算 。
- 圓潤倒角 :整個機身幾乎看不到銳角,創(chuàng)造了與人更和諧的關(guān)系 。
- 高級質(zhì)感 :樣機的腿部甚至用到了與Apple Watch同款的材料,以提升整體品質(zhì)感 。
- 銳利切割 :在需要的地方采用鋒利的切割線條,增加設(shè)計感,但觸感依然保持圓潤 。
「大頭」在自己下樓梯|圖片來源:維他動力
?
最終呈現(xiàn)的Vbot,在WRC現(xiàn)場的一眾四足機器人中,確實顯得有點不一樣的「萌」。
?
拆解「大頭」:一只四足機器人的大腦、算力與「心臟」
?
如果說設(shè)計哲學(xué)賦予了Vbot親和的「皮囊」,那么其內(nèi)在的技術(shù)架構(gòu)則是它擁有「靈魂」的基石。維他動力從一開始就意識到,要打造一個真正自主的機器人,必須摒棄傳統(tǒng)的路徑。
?
這其中核心之一在于對「算力」的理解和應(yīng)用。余軼南指出,今天的智能汽車,特別是高階智駕,往往需要在車身布滿多達(dá)12個攝像頭來覆蓋長焦和廣角,以感知周圍環(huán)境 。雖然總算力很高,但分配到每個攝像頭上的算力其實非常有限 。
?
Vbot則走了一條更精簡、更高效的路。「人其實通過兩個眼睛、兩個攝像頭就能覆蓋他基本移動的需求?!?余軼南解釋道。
?
Vbot采用了擬人的可運動雙目攝像頭設(shè)計,就像人可以通過轉(zhuǎn)動頭部來擴大視野一樣,這對攝像頭可以靈活轉(zhuǎn)動,使其水平視場角從固定的150度大幅提升至約230度,垂直視場角也從80度擴展到125度 。
?
這種設(shè)計的精妙之處在于,它不僅降低了對傳感器數(shù)量的依賴和硬件成本,更帶來了一個高效的結(jié)果:單位像素可用算力(TOPS/MPixel)遠(yuǎn)超主流智能汽車,約是其3到8倍 。
?
更高的「算力密度」意味著Vbot有能力在端側(cè)運行更大規(guī)模、更復(fù)雜的AI模型,這是其實現(xiàn)高級智能的關(guān)鍵前提。
?
為了應(yīng)對真實世界中復(fù)雜的異形障礙物和暗光環(huán)境,Vbot還額外配備了一個機器人專用的360°激光雷達(dá),確保在全場景下都具備可靠的避障能力 。
?
強大的感知能力需要一個同樣強大的「大腦」來處理。Vbot采用了雙系統(tǒng)設(shè)計:
智能本體域負(fù)責(zé)感知—決策—規(guī)劃—動作,運行于與地瓜機器人聯(lián)合的S100P芯片(最高128TOPS)——這是機器人的「運動中樞」;
智能交互域負(fù)責(zé)顯示、語音、光效與通信,運行與頭部X5芯片,實現(xiàn)高效低功耗的人機交互——這是機器人的「社交中樞」。
?
這種高度集成的中央計算架構(gòu) 帶來了另一個優(yōu)勢:節(jié)省空間。趙哲倫說:「過去拆開一個四足機器人,肚子里要放好多塊板子……今天由于我們高度集成,身體里有更大的空間可以來放電池包?!?/p>
?
這直接關(guān)系到機器人的「續(xù)航」這一核心痛點。傳統(tǒng)同級別的四足機器人電池容量普遍在400Wh左右,續(xù)航僅一到兩個小時。而Vbot憑借優(yōu)化的內(nèi)部結(jié)構(gòu),電量達(dá)到了600Wh以上,較行業(yè)上限提升了38% 。
?
不僅如此,維他動力還在與電池巨頭億緯鋰能(EVE Energy)合作,聯(lián)合開發(fā)更高密度的動力電池,有望將電量進(jìn)一步提升,實現(xiàn)超過6小時的戶外續(xù)航,完全滿足單日出行的需求 。
?
然而,Vbot不僅要「看得見」、「動得久」,更要「聽得懂」、「會思考」。為此,團隊為它設(shè)計了一套全新的Agent架構(gòu) 。
?
余軼南將它與我們熟悉的PC和手機交互做了對比:我們與電腦的交互距離很近,可以用鍵盤鼠標(biāo);與手機的交互距離更近,可以直接觸控 。但與機器人的交互,距離往往在幾米開外,掏出手機來控制,體驗其實非常不便 。
?
Vbot的Agent架構(gòu),就是想想要拋開遙控器和預(yù)設(shè)的圖形界面 。趙哲倫解釋道,有無遙控器的核心區(qū)別在于,對環(huán)境的感知由誰來承擔(dān)?!冈谟羞b控器的情況下,是控制者來承擔(dān)對環(huán)境的感知」。而沒有遙控器,這件事就需要機器人本身去實現(xiàn)。
?
機器人的Agent架構(gòu)|圖片來源:維他動力
?
它的核心是視覺—語言—行動(V-L-A)模型 ,統(tǒng)一了「看懂—聽懂—做對—解釋清楚」的全鏈路 。用戶輸入指令后,Agent大腦會利用思維鏈(CoT)和反思(Reflection)等機制,像產(chǎn)品經(jīng)理一樣理解意圖、拆解任務(wù),然后調(diào)度各種工具來完成 。
?
這些工具不僅包括機器人自身的感知和技能,還包括可擴展的物理世界工具(如通過多功能背板連接機械臂或運動相機)和互聯(lián)網(wǎng)服務(wù) 。
?
「它可以通過各種各樣的連接工具實現(xiàn)機器人跟世界的互動?!褂噍W南舉例說,Vbot可以拖著人玩滑板,也可以裝上一個特制設(shè)備,在網(wǎng)球場里自動撿網(wǎng)球 。這種可擴展的「任務(wù)工具鏈」,為用戶提供了豐富的應(yīng)用生態(tài) 。
?
注入「生命力」:用藝術(shù)的思維來創(chuàng)造靈魂
?
「我們是要打造有生命力的機器人。」趙哲倫在發(fā)布會上強調(diào),「工程科學(xué)的思維可以控制精度……但我們認(rèn)為必須得用藝術(shù)的思維來創(chuàng)造靈魂?!?/p>
?
這句話點明了維他動力不一樣的追求:讓機器人擁有「生命感」。他們認(rèn)為,過去很多機器人交互方式存在局限,要么被預(yù)設(shè)的圖形界面限制,要么只依賴語音而容易產(chǎn)生誤解 。
?
團隊從「LOVOT之父」林要那本為《溫暖的科技》的書中獲得啟發(fā)。書中提到,人與人之間的信息傳遞,55%依賴肢體語言,38%是語氣,而純粹的語言內(nèi)容只占7% 。這讓他們意識到,要讓交互變得自然、溫暖,就必須讓機器人擁有豐富的表達(dá)能力。
?
「機器人應(yīng)該怎么樣來去表達(dá)自己的情緒?不管是開心也好還是害怕也好?!筕bot給出的答案是:全模態(tài)交互 。它不僅有屏幕上的表情,更有肢體、揚聲器和指示燈的協(xié)同表達(dá) 。
?
為了讓這些表達(dá)生動可信,維他動力做了一件在機器人行業(yè)相對少見的事——聘請動畫師。趙哲倫介紹,他們將迪士尼動畫的十二法則,如節(jié)奏感(Timing)、夸張(Exaggeration)和吸引力(Appeal),融入到機器人的動作設(shè)計中 。
?
例如,通過控制動作的速度變化(加速度),來表達(dá)驚訝或喜悅的情緒;通過夸張的躲避動作,來告訴用戶它「害怕」前方的溝壑,無法通行;通過一些小動作展現(xiàn)其鮮明的個性,比如在思考時做出歪頭的姿態(tài) 。這些設(shè)計讓Vbot不再是一個執(zhí)行命令的機器,而是一個能夠傳遞情緒、有「性格」的伙伴。
?
除了情感表達(dá),Vbot也擁有「長期記憶」。趙哲倫向極客公園談到,他們的記憶系統(tǒng)分為三部分:空間、關(guān)系和信息。
- 空間記憶 :機器人需要記住家庭或辦公室的環(huán)境布局,能聽懂「去爸爸的房間」這樣的指令。
- 關(guān)系記憶 :通過聲紋和人臉識別,它能分清家庭成員,知道誰是誰。
- 信息記憶 :這是更深層次的交互記憶,讓機器人能夠理解并記住用戶的偏好和習(xí)慣。
?
這種對「生命感」的追求,背后是一定的技術(shù)支撐和清晰的商業(yè)規(guī)劃。維他動力成立僅半年,已先后完成種子輪和天使輪融資,累計融資規(guī)模達(dá)3億元人民幣,天使輪由達(dá)晨創(chuàng)投領(lǐng)投,聯(lián)想創(chuàng)投、渶策資本等跟投 ,資金也將聚焦于首款智能伴隨機器人的規(guī)模化量產(chǎn) 。
?
為此,他們組建了一個覆蓋電池、電機、算法、數(shù)據(jù)基建等全棧軟硬件的60多人研發(fā)團隊 ,并與京東(新零售)、火山引擎(大模型算力)、地瓜機器人(端側(cè)算力)、禾賽科技(傳感器)和億緯鋰能(電池)等行業(yè)巨頭達(dá)成了深度合作 。
?
一條清晰的路線圖已經(jīng)鋪開:9月啟動制造工廠,10月到12月開啟早鳥內(nèi)測,年底正式上市,并在明年1月的CES展會上開啟海外眾測 。他們也有一個更長久甚至宏大的目標(biāo):5年內(nèi),讓機器人大規(guī)模進(jìn)入家庭和辦公場所;10到20年,成為全球前三的智能機器人公司 。
?
當(dāng)被問及為何不做更「酷」的人形機器人時,趙哲倫向極客公園坦言,人形機器人的技術(shù)挑戰(zhàn)依然巨大,且他們認(rèn)為第一款家用產(chǎn)品「個子不能比孩子高」,以保證親和力和安全性。
?
從智能汽車產(chǎn)業(yè)汲取養(yǎng)分,到用「算力密度」重塑硬件架構(gòu),再到以「生命感」定義交互體驗,維他動力正在走一條此前未被走通的路。他們丟掉了遙控器,因為這迫使機器人必須真正地理解世界。
?
維他動力創(chuàng)始人|余軼南
?
余軼南說,「智能手機跟非智能手機最大的區(qū)別是沒有物理按鍵,無人駕駛跟輔助駕駛最大的區(qū)別是沒有方向盤?!?而Vbot正在做的,就是拿掉機器人的「遙控器」,推動其向一個更自主、更智能的方向發(fā)展。
?