智東西(公眾號:zhidxcom)
作者 | 程茜
編輯 | 心緣
距離人形機器人給你端茶送水的日子還有多久?這一場景已不再是異想天開。
1972年,日本早稻田大學的全球首臺全尺寸人形智能機器人WABOT-1邁出10厘米花了45秒;2023年,一家國內創企的人形機器人小星,1秒鐘就走了70厘米。
51年后,人形機器人從顫顫巍巍緩步行走,已經進化到能幫你取咖啡、烤串,還能在草地、野外落葉路、石子路等各種復雜路面穩步前進。
小星出自2023年8月成立的星動紀元,就在本周,這家創企完成了超億元天使輪融資,由聯想創投領投。此前該公司還完成了由世紀金源領投,圖靈創投跟投的數千萬元種子輪融資。
星動紀元機器人本體、驅動器、關節電機、控制算法等這些與人形機器人本體、小腦、大腦三大核心相關的零部件已經實現了完全自研。
預計2024年,星動紀元將推出全尺寸人形機器人,實現小批量量產出貨,前期主要面向科研場景,并逐步擴展到工業、服務等多種場景。
其背后的靈魂人物就是清華大學交叉信息研究院助理教授、博導陳建宇,他在機器人領域已經有10余年研發經驗,曾經涉足四足機器人、機械臂、無人車等。
大模型橫空出世,人形機器人向更通用智能進階,陳建宇聯合團隊發表了大型語言模型與人形機器人算法相結合的論文(論文地址:https://arxiv.org/abs/2307.00329),用大型語言模型指導小星的上層任務規劃,用強化學習來獲取小星的底層控制器。
去年以來,人形機器人產業的熱度空前高漲,國外巨頭玩家量產信號頻發,遇到大模型的人形機器人“大腦”突飛猛進,在這種種變化背后,這家成立不久的創企將如何在人形機器人新時代寫出自己的獨特故事?
智東西與星動紀元創始人、CEO陳建宇進行了一場深入的對談。這一切,要從他小時候的“機器人夢”說起。
▲星動紀元創始人、CEO陳建宇(身穿白衣)與星動紀元人形機器人小星合影(中下)
一、從保送清華啟程,“機器人夢”逐漸照進現實
小時候,機器人的種子就開始在陳建宇的心里默默生根發芽。
受身為大學老師的媽媽影響,孩童時期的陳建宇經常出入大學物理實驗室,觀摩了一場場神奇的實驗后,在百科全書和科幻電影的幫助下,他的腦海里構建起了對科技的初步認知。陳建宇說:“說不清楚為什么,我覺得這種科技含量高的東西,讓我覺得非常興奮、非????!?/span>
2011年陳建宇就被保送到清華大學,就讀精密儀器與機械學系——當時國內最早做人形機器人研究的單位之一。
一直伴隨著陳建宇的機器人夢,在他的本科生涯中開始具象化,本科前兩年接觸機器人硬件,后兩年關注機器人算法,本科畢設涉足了雙足機器人步態規劃。
2014年,陳建宇申請到美國加州大學伯克利分校讀博,當時師從美國國家工程院院士、機電控制學科先驅Masayoshi Tomizuka教授。
在海外讀博期間,正值無人車技術興起,陳建宇的主要課題方向大多為無人機、機械臂,當時他關注的兩條技術路線分別為模型預測控制(MPC)以及強化學習,這也是星動紀元現在做人形機器人的研究方向和算法。陳建宇解釋,這是因為無人車本質上就是一款機器人,兩者底層的模型結構很相似,只不過人形機器人的控制方面難度更多。
博士畢業回到清華大學時,陳建宇一開始嘗試了研發無人車、機械臂、四足機器人等。2021年底,當技術積累逐漸增多,陳建宇內心的機器人夢重燃了,他要做一款自己的人形機器人。
2022年春夏之交,他正式啟動了通用機器人的研究課題。
隨著研發的深入,陳建宇開始思考人形機器人能發揮的更大價值,“理論上來看,沒有一款機器人能像人形一樣具備如此高的靈活度,以及完美跟人類社會適配的能力”,所以人形機器人未來上市可以對整個社會產生影響,技術逐漸成熟使得這一新形態的產品能真正走進人們的生活。
這一思考的最終答案就是,從酷炫走向務實,他萌生了去“做一家公司”的想法,讓人形機器人的價值通過產品化、商品化的形式體現出來。
二、兩年研發四代人形機器人,兩種形態涵蓋絕大部分場景
2023年8月,星動紀元正式成立,但他們的人形機器人產品誕生要早得多。
陳建宇透露,2022年春夏之交開始研發第一代“小星”,第二代從2023年初啟動到7月初首次曝光,第三代與第二代的研發開始時間只間隔1~2個月,8月份正式亮相,如今已經迭代到了第五代,可以連續上下樓梯和上下坡 、自然步態行走,并實現極度崎嶇地面、極度外力作用、30cm落差地面等條件下的自主平衡。
目前,星動紀元的人形機器人分小星和小星MAX兩種形態。
從具體的應用場景來看,小星身高121厘米,體重28千克,身形小巧的它更注重通用移動能力,相對簡化手部功能,可能會搭載一個抓夾來完成戶外的物流、巡檢等任務。
陳建宇談道,小星不需要做太多需要精細操作的任務,并且其體積更小、自由度更精簡,成本更低。在運動方面,它的跑跳、運動、平衡等能力能夠更容易實現。
小星MAX從命名上也可以看出,其自由度、尺寸相比小星都更高、更大,身高為166.2厘米,體重46千克,手部還搭載了靈巧手,他們的設想是,讓小星MAX能代替成人真正干活,進入工廠和家庭。
陳建宇認為,目前星動紀元具備的這兩種形態已經基本涵蓋絕大部分場景,未來他們可能會通過部件模塊化做一些場景細分。
為什么星動紀元能做到如此快的迭代速度?背后星動紀元研發團隊構建的完善技術棧起到關鍵作用。星動紀元在硬件領域的研發人員都和陳建宇一樣,有十余年的經驗積累,算法領域的團隊還會包含學術研究能力強的高校博士畢業生,他們都對人形機器人有非常強的信念,或者可以說他們和陳建宇一樣,都有一個“機器人夢”。
在這個信念的支撐下,星動紀元一步步搭建起了自己的技術棧:先是初步搭起硬件層,讓機器人先走起來、走得更靈活以及核心零部件全自研同步推進,然后給機器人裝上眼睛、搞定雙腿雙手。這正是從去年到現在,他們在做的事。
陳建宇對于星動紀元的未來是這樣規劃的:在技術上,做到從1到10,讓小星走起來、跑起來、跳起來,同時手部動作更通用、操作能力更強;在產品上,做到從0到1,更快實現產品的量產、市場開拓、產品打磨。
在這背后,陳建宇抽象出了一家人形機器人創企的成功關鍵,那就是過硬的硬件能力、對機器人和AI能力的深入研究以及很強的學術能力,最后一點的關鍵在于,很多人形機器人領域的技術難題需要學術研發能力進行發現總結,并將這些新的問題總結轉化成產品。
三、三大核心要素,關節電機峰值轉矩密度超頭部玩家
在陳建宇看來,人形機器人必備的三個要素就是,好的本體、靈活的小腦、發達的大腦。
第一個是本體,為了讓人形機器人的本體更加靈活,在硬件側,星動紀元自研本體感知驅動器,使用自研高扭矩密度模塊化關節以及一體化結構設計,核心零部件完全自研,使得機器人能夠移動迅速,同時抗沖擊能力更強,成本更低。陳建宇談道,他們是國內最早一波做出來的。
其中,關節電機采用了正弦化磁場調制及電磁負荷調配技術、磁路拓撲結構優化及電磁-結構-流體多物理場耦合設計等關鍵技術及方法,峰值轉矩密度高達36Nm/Kg,并獲得了第三方標準化檢測報告,比目前市面上可以買到的德國TQ電機核心指標高一倍以上。
▲星動紀元自研本體感知驅動器
目前,小星已經可以在草地、石子路、落葉等多種復雜路面上實現穩定行走,陳建宇解釋道,他們主要采用了兩種方法,首先是高頻力控,人形機器人通過高頻反饋的力控制器,在應對突發干擾時,能及時調整身體狀態;其次是強化學習,這一方法能進一步提升人形機器人的穩定性,他們已經將同樣算法印證了四足機器人可以適應復雜地形,正逐步在人形機器人上遷移印證。
第二個是小腦,靈活的小腦是控制機器人平衡的重要支撐,針對于人形機器人的應用特點,星動紀元優化了控制算法,使得人形機器人的平衡控制、動態性能更高。
研發小腦部分的算法層面,星動紀元主要采用的是仿真訓練,陳建宇介紹了兩種方法:基于模型和基于數據。
首先,基于模型的控制方法可以通過高精度物理仿真測試機器人,并且在仿真中對算法進行判斷驗證,就可以提高機器人相關性能的測試效率,同時降低機器人本體測試過程的損壞頻率;基于數據的方式指的是,人形機器人在仿真里進行走路的嘗試和交互時會獲取到很多數據,這就可以進一步做為其數據來源學習如何走路,基于其在仿真里見到的不同情況學會應對各種任務,然后再將算法遷移到真機上。
星動紀元還研發了雙臂靈巧手算法,陳建宇舉了個例子,他們在仿真里可以讓靈巧手拿起一個復雜形狀的東西,然后扔到另一只手上,或者雙手配合玩魔方等。
第三個就是大腦,人形機器人需要發達的大腦,讓機器人足夠智能來完成指令。陳建宇談道,星動紀元在全球首次提出將視覺語言模型、大語言模型與人形機器人算法進行整合,用大型語言模型指導小星的上層任務規劃,用強化學習來獲取小星的底層控制器,構成的框架可以增強其執行任務的智能性和泛化性。
▲星動紀元提出的視覺語言模型、大型語言模型與人形機器人算法整合框架
與此同時,陳建宇稱,他們還會自己設計Benchmark,讓小星在一些有障礙物的環境里避障,按照指令搬運物體、根據相應的菜譜完成食物的準備工作等。
他還提到了星動紀元下一步重要研發方向,前面提到的這套框架下大腦和小腦相對分離,中間會通過語言等媒介實現交互,他們將思考如何讓大腦和小腦結合的更加緊密,甚至于讓大腦本身擁有小腦的一些功能,不光處理語言、視覺,還可以生成一些行為、動作,在整個動作控制層面的效果和智能性上得到進一步提升。
此外,人形機器人還有一大好處就是,因為其與人的外形相似,可以靠人做相應的動作拿到數據,然后機器人從中學習,使得數據獲取成本更低。
四、未來,人形機器人總量將超任一專用機器人
大模型引爆的新技術革命激戰正酣,被看作通用人工智能終極載體的人形機器人迎來了新風口。陳建宇談道,近年來人形機器人本體技術的快速演進與大模型的出現,使得人形機器人的泛化能力實現了從0~1的跨越。
工廠的機械臂等機器人相關應用已經相對成熟,但其局限在于做的事情較為有限,人形機器人這類新一代機器人,隨著大模型的出現,在硬件、軟件、智能性、交互性等方面得到更大提升。他認為,從技術可行性的角度來看,也就是說開發出下一代機器人的可能性已經具備。
除了技術突破外,還有一大變化就是如今人們生活質量提升,一些傳統勞動崗位出現招工難,可以彌補生產力缺口的人形機器人需求上漲。
人形機器人因其與人類相似的外形特征,和整個人類社會環境的適配度很高,幾乎可以適用于所有場景。
因此,陳建宇認為,最終的結果就是在每一個場景里,有一兩款專門的特有機器人去完成一部分工作,人形機器人去做剩下的工作,所有這些場景加起來,這有望使人形機器人的需求量超過任何一類專用機器人。
除了大模型發展外,市場還釋放了很多積極信號。馬斯克在特斯拉二季度業績會上透露將在11月進行人形機器人行走測試,同時其樣機迭代從“功能實現”進入了“量產實現”環節。
值得一提的是,馬斯克的人形機器人以及亞馬遜投資的Agility Robotics公司都選擇了讓人形機器人進入工廠、倉儲等環境中試用,通過打磨迭代,再進行量產。陳建宇透露,星動紀元也是如此,他們將通過合作方提供的一些場景,進行人形機器人試用和產品打磨。
結語:大模型時代,人形機器人商用落地升溫
如果回溯人形機器人產業的發展歷程,可以看出現如今其技術及商業落地的迭代節奏遠快于前幾十年。
陳建宇談道,上個世界七八十年代,日本對人形機器人的研究主要停留在緩慢的步態行走;2018年往后,波士頓動力讓人形機器人變得更加動態;現在隨著大模型的出現,人形機器人進入了智能化+商業化落地的重要階段。
在這個過程中,波士頓動力作為人形機器人產業具有標志性意義的公司,其在技術領先性上毋庸置疑,但對于人形機器人創企而言,他們需要做性能和商業化的平衡。陳建宇認為,要將機器人成本和人的工資進行對比,按照工資來算能實現回本,人形機器人才有商業化的價值。
他補充說,具體的應用場景是否需要人形機器人負重、搬運、走得快或者小跑等才是影響他們設計的標準。
不過,相比于國外巨頭在技術上的領先,國內人形機器人的迭代進展更快,再急于場景豐富的國內土壤,機器人真正放到場景里去打磨、迭代的可能就會更多。陳建宇相信,國內人形機器人創企如果以現在的速度保持產品、技術迭代,“超越國外巨頭是遲早的事”。