神經網絡之父 Hinton 闡述 40 年的研究,或重塑 AI 技術
作為多倫多大學教授,Geoffrey Hinton于2012年10月將AI領域的發展推向了新的軌道。在兩名研究生的幫助下,Hinton展示了一種不太流行的技術——人工神經網絡。Hinton已經在這個領域研究積累了數十年,人工神經網絡使得機器能夠理解圖像的能力有了巨大飛躍。
如今,人工神經網絡已經可以轉錄我們的演講、識別我們的寵物,并幫助我們與“網絡巨魔”作斗爭。但Hinton現在卻對這種他幫助推出的技術發起挑戰,他說:“我認為我們研究計算機視覺的方式是錯誤的。雖然它現在比其他任何東西都管用,但這并不意味著它是正確的。”
Hinton現在分享了他的另一個“舊想法”,這可能會改變電腦“觀看”的方式,并重塑AI。計算機視覺非常重要,對于無人駕駛汽車或充當醫生的軟件來說更是如此。上周,Hinton發表了兩篇研究論文,闡述了他已經研究了近40年的一個想法。他說:“在很長一段時間里,這對我來說都是一種直覺感覺,只是效果不太好。現在,我們終于取得了進展。”
在第二種情況下,Capsule網絡幾乎將之前最好測試的錯誤率降低了一半,這種測試挑戰軟件從不同角度識別卡車和汽車等玩具的難度。Hinton始終在與谷歌派駐在多倫多的兩名同事共同研究他的新技術。
Capsule網絡旨在彌補當今機器學習系統的缺陷,這些缺陷限制了它們的有效性。谷歌和其他公司今天使用的圖像識別軟件需要大量的示例照片來學習,包括如何在各種情況下可靠地識別對象。這是因為該軟件并不擅長將其對新場景知識進行泛化,例如從新的視角觀看相同的對象時,準確地將其識別出來。
舉例來說,教電腦從多個角度識別一只貓,可能需要成千上萬張不同角度的照片。而人類孩童不需要如此明確和廣泛的訓練,就可以學會識別一只家養寵物。
Hinton的想法是縮小最好AI系統和普通幼兒之間的認知鴻溝,以便在計算機視覺軟件中建立更多的知識。 Capsule(少量粗糙的虛擬神經元)被設計用來追蹤物體的不同部位,比如貓的鼻子和耳朵,以及它們在空間中的相對位置。由許多Capsule組成的網絡可以利用這種方式來加強理解,明白從不同視角看到的物品依然是此前相同的對象。

現在就說Hinton取得了“大躍進”還為時過早,他自己也知道這一點。這位經驗豐富的AI專家的直覺已經得到了證據支持,他解釋說Capsule網絡仍然需要大量圖像支持,并且當前的系統與現有圖像識別軟件相比速度更慢。但Hinton非常樂觀,他自信可以解決這些缺點。該領域的其他人也對他的長期成熟想法抱有很大希望。
圖像識別初創公司Twenty Billion Neurons聯合創始人、蒙特利爾大學教授羅蘭·梅尼塞維奇(Roland Memisevic)說,與當前系統相比,Hinton的基本設計應該能夠從數據中提取出更多信息。如果能夠在更大范圍證明這一點,那將會對醫療保健等領域有所幫助。在這些領域,用于培訓AI系統的圖像數據遠比互聯網上的自拍照更少。
從某些方面來說,Capsule網絡與AI研究最近的趨勢有所不同。最近對神經網絡成功的一種解釋是,人類應該把盡可能少的知識編碼到AI軟件中,然后讓它們自己從頭開始計算。
紐約大學心理學教授加里·馬庫斯(Gary Marcus)去年曾向叫車服務公司Uber出售了一家AI初創公司,他說,Hinton的最新研究代表了一種新的可能。
馬庫斯認為,AI研究人員應該做更多的事情來模擬大腦的內在機制,來學習像視覺和語言這樣的關鍵技能。他說:“現在還不知道這個特定的架構會走多遠,但看著Hinton打破這個領域的慣例,感覺非常棒!”(小小)