從早稻田大學1972年研發的WABOT,到特斯拉2022年首秀的Optimus,人類科學家對人形機器人的研發走過了半個世紀。在這半個世紀里,人形機器人的發展已經從本田ASIMO、波士頓動力Atlas代表的技術驗證期,過渡到了以特斯拉Optimus為代表的商業試水期,一個新的機器人時代正在開啟。
為此,至頂科技特別策劃推出《機器人新紀元》專題報道,旨在探尋全球機器人團隊的技術變遷和創新故事。
本篇為《機器人新紀元》專題報道第三篇深度文章。
作者| 金旺
欄目| 機器人新紀元
2007年,回到國內的黃曉慶進入中國移動,開始接手中國移動研究院的工作。
對于他來說,這是一個新的開始,對于中國通信產業來說,這同樣是一個不可多得的黃金發展時期。
2008年,中國正式迎來了3G時代,讓不少人興奮的移動互聯網大門在這一年緩緩打開,然而3G在網絡制式上存在的缺陷,讓全世界的運營商為之頭疼。
作為中國通信產業三大運營商之一,中國移動有著絕對大佬的江湖地位,身為中國移動研究院院長的黃曉慶,他的團隊又剛好是中國移動制定標準的那群人。
在那個特殊位置、在那個關鍵時間節點上,黃曉慶做了一個大膽的假設——將3G和4G兩代移動通信技術一起干。
后來,中國移動成了全球唯一一個同時開展3G、4G網絡技術研究、標準制定的運營商,并在2014年率先實現了4G網絡的規?;逃?,中國通信技術自此開始趕超世界。
也是在這時,黃曉慶有了一個新的計劃,一個新的十年計劃——做一家機器人運營商。
01 兩個第一性原理,一個機器人公司
黃曉慶創立達闥機器人,是在2015年,這一年,他辭去了中國移動研究院院長一職,對于在通信行業堅守了30多年的他來說,這次辭職創業被不少朋友視為是一次跨界。
不過,黃曉慶并不這么認為,“實際上我并沒有跨界。”
在通信行業那30多年里,黃曉慶見證了通信產業的大繁榮,也親身參與并主導了諸多通信技術、重大專項研發和標準制定工作。
不過,黃曉慶認為,在通信行業這些年里,他最重要的工作其實是創造需求,通過新需求、新應用驅動通信產業高速發展。
智能手機之后,誰會是推動通信產業爆發式增長的下一個需求?
這是黃曉慶2012年在中國移動研究院思考的一個問題。
這一年,4G網絡趨于成熟,一些機器人團隊開始嘗試將4G技術應用到機器人上,在中國移動為通信產業“制造需求”的黃曉慶很快注意到了這件事,深入研究后,他發現,原來機器人真的需要互聯網,尤其是移動互聯網。
與此同時,他還有了另一個發現,大多數機器人團隊的技術路線都是以機器人本體為基礎,通過在本地改進算法、增加算力來增強機器人能力,而這種模式,在未來很可能會行不通。
這樣的判斷,源自于黃曉慶當時發現的兩個第一性原理:
第一,集成電路比神經元耗電1億倍。
集成電路是一個電子系統,神經元是一個生物系統,這兩個系統的功耗相差1億倍,這意味著如果你想造一個智能水平和人一樣的計算機,它的功耗要比人腦功耗大1億倍,它的腦袋至少也要比人腦大1萬倍,如果用傳統設計方法,這樣的機器人顯然是無法造出來的。
第二,無線網絡比人的神經網絡傳遞信息的速度要快10億倍。
神經網絡傳遞信號的速度是300m/s,無線網絡傳遞信號的速度是光速,也就是30萬公里/s,這意味著,如果可以將機器人的大腦放到1000公里以外,信號傳輸延時可以控制在3ms以內,這樣的延時幾乎可以忽略不計。
“馬斯克曾說過,發現一個第一性原理就可以創業了,而我發現了兩個。”
基于這兩個第一性原理,他認為,未來的機器人肯定是云端機器人。于是,做云端機器人的念頭開始在他的心底生根發芽,他也開始等待一個絕佳時機。
這一等,就是兩年。
2014年,中國移動率先在全世界實現了4G網絡的規?;逃?,并在這一年完成了100萬個基站的部署,4G網絡用戶增至1億。
基于此,黃曉慶又有了兩個新的判斷:
第一,中國會在5-6年內部署5G網絡,而5G網絡會是云端機器人構想成立的關鍵;
第二,人工智能在十年內會有重大突破。
這讓黃曉慶意識到,他等待的絕佳時機已經到來。
于是,達闥機器人在2015年正式成立,也是在達闥成立的這一年,黃曉慶定下了一個十年目標——10年內做出家庭保姆機器人。
02 將云端大腦賣給孫正義
和大多數機器人創業團隊不同,希望做機器人領域運營商的達闥,并沒有從造機器人本體入手,而是從造腦計劃開始。
達闥公司創立之初,黃曉慶為公司制定了兩個研究方向:
一個是云端大腦,另一個是網絡安全。
前者是基于5G、云計算技術的云端機器人大腦,是黃曉慶通過兩個第一性原理推導出的未來機器人產業的核心,也是基于此,達闥后來研發了海睿云端機器人操作系統。
后者則是實現達闥云端機器人運營商這一構想的重要保障,達闥由此也研發了自己的移動內聯網。
然而,即便有了云端大腦和移動內聯網,機器人本體依然必不可少,最快、最有效的方法是找有機器人本體的團隊合作。
早在達闥開始造云端大腦時,黃曉慶就開始在全世界找“靠譜”的機器人團隊。
2015年,全世界有三個人形機器人明星團隊最為閃耀,一個是波士頓動力的Atlas、一個是本田的ASIMO,還有一個是軟銀孫正義2012年1億美元收購的法國公司Aldebaran。
不過,這三個團隊中,只有后者一直在花大量的資金和資源,嘗試將造出的人形機器人Pepper推向市場。
由于有軟銀在資金和資源上的支持,2015年,Pepper在全球拿到了5萬臺整機訂單,孫正義眼看自己的Pepper開始走向全世界,更是大手筆向富士康下了50萬臺設備的訂單,這樣一個龐大的數量已經超過了2015年全球服務機器人市場的整體體量。
由于在通信技術領域與孫正義有過深度合作,在黃曉慶創業達闥時,他也將自己的兩個第一性原理和云端機器人理念告訴了當時對機器人頗為癡迷的孫正義,孫正義聽后不僅十分認同黃曉慶云端機器人的理念,還成為了達闥的主要投資人。
隨后在軟銀正式立項Pepper,并計劃將Pepper機器人賣到全球時,黃曉慶看到了Pepper機器人的潛力,并向孫正義提議,達闥可以為Pepper造一個云端大腦。
彼時,Pepper雖然在全球擁有不錯的聲量,也拿下了不少訂單,但故障率高、智能性差也讓這一機器人備受詬病。 云端大腦,確實值得一試。 于是,達闥團隊開始為Pepper裝上新的RCU和控制器、4G模塊,研發了云端大腦。
“如果當時我們這次合作能順利進行下去的話,Pepper將會是第一個擁有云端大腦的機器人,我們也會借助Pepper將云端大腦帶到全世界,”黃曉慶告訴科技行者。
然而,現實往往不會讓新舊技術理念交替來得這么快。
和軟銀的合作最終由于種種原因未能如愿進行下去,但達闥最終還是將Pepper這款黃曉慶認為“世界上最好的人形機器人”帶到了國內。
2017年8月,在第三屆世界機器人大會上,一款名為Cloud Pepper出現在了達闥的展臺上,可愛的外表,外加炫酷的表演,引得現場不少觀眾圍觀。
Cloud Pepper作為達闥第一款產品,這一年也在國內開啟了商業化之旅。
03 像造手機一樣造機器人
Cloud Pepper在國內面世后,國內服務機器人市場難得出現了一些變化。
“我們當時賣出了不少產品,而且大家都很喜歡這款機器人,”回憶起當時Cloud Pepper進入各大線下門店時的場景,黃曉慶依然很是興奮。
不過,由于Pepper團隊在技術和產品上長期沒有迭代更新,黃曉慶不得不考慮重新找一家合作廠商,或者收購一家機器人團隊。
2017年,已經在機器人領域闖蕩了兩年的黃曉慶已經意識到,模塊化關節對于機器人,尤其是人形機器人極為重要,并開始在國內外尋找潛力團隊,也就在這一年,幾經輾轉,黃曉慶遇到了前沿驅動。
在收購前沿驅動時,黃曉慶對于人形機器人已經有了更深入的思考和規劃。 他認為,達闥未來幾年需要造四臺機器人:XR1、XR2、XR3、XR4,而所有機器人都需要的一項關鍵技術,正是智能柔性關節。
智能柔性關節和傳統機器人關節有什么本質差異?
黃曉慶告訴我們,傳統控制器控制電機、傳感器的模式類似于上個世紀八十年代的電腦,一個主機需要控制多個外設,在這樣的機器人控制系統中,控制器控制8個、10個關節都還OK,但一個人形機器人可能會有60多個關節, 傳統機器人控制系統很難很好地控制一個這樣的復雜系統。
在黃曉慶的設想中,每個智能柔性關節相當于移動互聯網中的一部手機,有獨立的授權和通信網絡,有獨立的操作系統和執行能力。 而這其中的關鍵,是讓所有關節都具備獨立的計算能力和通信能力。
2019年2月,在經歷了16個月的研發后,達闥第一代搭載智能柔性關節的智能柔性服務機器人Ginger在MWC 2019上正式亮相。
這個首次采用了智能柔性關節設計理念的Ginger,正是達闥最初規劃的四類機器人中的人形輪式機器人XR1。
這一年,XR1開啟的,是達闥云端大腦產品化的新階段。
04 機器人的終極形態
作為達闥一款重要的機器人產品,Ginger看起來有點像最初的Cloud Pepper,實際上,這也是達闥用自己的思路,自研了一個全新的Cloud Pepper。
正是這款機器人,讓達闥在2021年迎賓機器人迎來高潮時,迅速在市場上出貨上千臺,不過,黃曉慶也坦言,Ginger不是機器人的終極形態。
在黃曉慶的構想中,機器人肯定是通用的,這和大部分基于一個垂直場景進行產品優化的機器人研發理念有著不小的差異。
“優化講的是場景定制,通用的結果則是量產,是‘手機理論’,”黃曉慶這樣解釋二者的區別。
此外,黃曉慶在2017年仔細思考機器人未來形態時,他發現,我們無法用一個機器人完成當下所有工作,但是可以用4個。
人形機器人是大多數機器人團隊研發機器人的終極目標形態,但在2017年思考這一產品形態時,黃曉慶發現,足式人形機器人不僅技術難度高,而且制造成本昂貴。
實際上,人類大部分工作空間都是平整地面,人形輪式機器人不僅可行,而且比足式機器人省電30倍。
這也就有了達闥第一代人形機器人Ginger的最初構想。
在深入了解機器人產業后,黃曉慶的另一個發現是,人形機器人抗不了重物,因而他又構想出了“四輪車+雙臂”和“四足機器人+雙臂”的XR2、XR3機器人形態。
而就人形機器人終極形態,達闥在今年WRC 2023上展示的 “小紫”正是黃曉慶構想的XR4。
黃曉慶希望未來進入千家萬戶的保姆機器人,正是這款名為“小紫”的人形機器人。
值得注意的是,這臺名為“小紫”的人形足式機器人,不僅采用了柔性關節設計,還應用了并聯關節設計。
并聯關節設計有什么好處呢?
由于相較人體的動力系統,人形機器人的電驅系統并不是一個理想電動驅動系統,伺服電機的能量密度要比人類肌肉小10倍。
如何用伺服電機很好地驅動機器人的大腿,就成了業界一個普遍難題。
達闥在設計“小紫”時,是將四個伺服電機進行了并聯,以此提供更充足的動能,支撐后續更強勁的運動能力。
黃曉慶認為,雖然人形雙足XR4是機器人的終極形態,但XR2或XR3這類機器人仍會長期存在。 “這有點像現在的人和汽車的關系,汽車無法取代人類雙腿,但作為出行和載物的一種便捷的交通工具仍會長期存在。”
實際上,達闥的XR2已經找到了一個新場景——農業采摘,黃曉慶認為,這是一個擁有巨大潛力的機器人應用場景。
而對于什么是符合機器人的應用場景,黃曉慶有著一套自己的衡量標準——機器人幫人干活兒是否能夠只“收”一半的錢。
也是基于這個標準,黃曉慶告訴科技行者,現在大家都在講人形機器人進工廠,但實際上,工廠中的地面也都是平整的地面,因而并不需要雙足,除去汽車總裝這樣特殊的環境,輪式人形機器人就能完全勝任,工廠環境更需要的應該是靈巧手和機器視覺。
真正的雙足人形機器人,更應該成為的是家庭保姆。
只不過,這在2021年來看,依然有些遙遠,那時,沒人能想到,變化很快將會發生。
05 大模型讓奇點到來
2022年11月30日,總部位于舊金山的OpenAI面向全球發布了ChatGPT,人工智能自此被推向了大模型時代。
對于今年人形機器人熱潮背后的真正原因,黃曉慶認為毫無疑問是AI大模型的突破,對于人形機器人這些年產業化的艱難歷程,他認為主要原因正是“人工智能不到位”。
“過去很多人做人形足式機器人,直到現在也沒能實現產業化,原因是人工智能沒有到位,現在人工智能到位了,帶來的直接結果是,我們能造出和人一樣聰明的機器人了。”
實際上,在今年上半年,硅谷的不少投資人已經開始關注大模型應用類的創業項目,例如用大模型解決管理問題,用大模型解決營銷問題,甚至用大模型做人類助手,而用大模型最終來解決機器人的問題,實際上是多模態大模型。
達闥早在2020年就開始接觸深度學習,到2021年,達闥的團隊已經在用深度學習訓練機器人。
黃曉慶認為,“在用深度學習訓練機器人這方面,中國的團隊一點都不落后于國外,由于一上來我們就是結合4G技術開展的研究,我們其實少走了很多彎路。”
2023年6月,達闥海睿操作系統更新到5.5版本,在這一版本中,達闥融入了自主研發的RobotGPT,“大模型+柔性關節控制”這兩項被黃曉慶視為未來機器人的重要技術支柱,成了海睿OS 5.5的獨特技能。
這也是黃曉慶眼中具身智能該有的樣子。
對于大模型在人工智能領域帶來的技術突破,黃曉慶還有另一個更為樂觀的看法:
“很多人沒有意識到一點——ChatGPT發布后,我們就已經突破了人工智能的奇點,不是奇點已近,而是奇點已來,奇點之后,機器人保姆很快就會出現。”
黃曉慶認為,2023年必將會是載入史冊的一年,而他更愿意將這一年稱之為“機器人覺醒之年”。
好文章,需要你的鼓勵
想象一下,你有一個非常聰明的朋友,他知道很多知識,但每當需要使用計算器、搜索引擎或查詢最新天氣時,卻變得像個笨手笨腳的孩子。這正是當前大語言模型(簡稱LLMs,如ChatGPT這類AI系統)面臨的尷尬處境。
想象一下,你擁有一個聰明的助手,它知道很多知識,但在面對需要使用計算器、搜索引擎或查詢最新信息時卻顯得笨手笨腳。這正是當前大語言模型(LLMs)面臨的困境。雖然這些模型已經通過監督微調(SFT)學會了使用工具的基本能力,但它們常常在面對復雜或不熟悉的場景時表現不佳。
想象你正在和一個智能助手聊天。如果你直接要求它提供有害信息,它很可能會禮貌拒絕。但如果你通過一系列看似無害的對話,逐步引導它走向你的真實目標呢?這就是當前AI安全領域面臨的一個嚴峻挑戰——多輪對話中的安全漏洞。
想象你在使用一個非常聰明的AI助手完成一項復雜任務,比如解決一道數學難題。你可能注意到這個助手會花很長時間"思考",一步一步寫下大量推理過程,最后才給出答案。雖然這種詳細的思考過程確實幫助AI做出了更準確的判斷,但同時也帶來了一個明顯的問題:它太"啰嗦"了,消耗了大量的計算資源和時間。