元動力 —— 人形機器人概述及投資分析
2024-11-06
來源:36氪
行業研究是投資的源動力。元禾控股推出“元動力”系列行研分享,編輯部據此推出《元動力》行業研究專欄,旨在交流行業研究成果,分析行業發展趨勢,探討未來投資方向。
本期《元動力》行業研究專欄聚焦人形機器人,分享者是 元禾控股研究中心(博后站)分析師閆亞東 ,將從人形機器人概述、核心技術拆解、發展趨勢及投資分析等維度進行展開。
人形機器人概述
人形機器人是機器人行業 從專用到通用場景的升級 ,它是具備人類外形特征和行動能力的智能機器人,以雙腿行走的方式,通過手臂和身體的協調完成功能,基于通用型算法和生成式AI,具備語義理解、人機交互、自主決策等能力,并利用人機交互實現任務理解與反饋,有強大的感知計算與運動控制能力。
智能化 、 通用性 ,這是人形機器人區別其他機器人產品的兩個特點。
人形機器人發展歷史久遠。自20世紀60年代開始,人形機器人歷經早期、高度集成、高動態、商業化落地等不同發展階段,也誕生了非常令人驚艷的人形機器人Demo和產品,比如本田ASIMO和波士頓動力Atlas。
但本田ASIMO和波士頓動力Atlas都沒有商業化量產,原因首先在于 成本居高不下 ,達到百萬美元以上,其次也是還有軟硬件上的 技術難點未被完全攻克 。
在投融資方面 :從數據來看,近兩年來,隨著大模型出現、核心零部件國產替代,全尺寸人形機器人技術壁壘與研發成本下降,一批新型初創公司開始出現,人形機器人賽道投融資比較火熱。2024年前三季度,人形機器人賽道億元級別的融資案例屢見不鮮。
2024年1-9月中國人形機器人億元及以上投融資事件,來源:元禾控股
在政策支持力度方面 :2023年11月,工業和信息化部印發《人形機器人創新發展指導意見》,提出人形機器人有望成為繼計算機、智能手機、新能源汽車后的顛覆性產品,并明確2025年實現批量生產、2027年相關產品深度融入實體經濟成為重要的經濟增長新引擎,這是國家層面首個僅針對人形機器人的政策方案。
在專利數量布局方面 :目前已經積累的技術主要集中在本體結構部分,驅動控制以及智能感知領域;其次,核心零部件以及支撐環境分支目前相對較少;中國、日本、韓國、美國、法國是目前持有專利數量排名靠前的國家;本田、優必選以及三星是全球持有人形機器人有效發明專利數量靠前的企業。
近年來主要人形機器人產品,來源:中航證券研究所
在產業鏈方面 :上游是電機、減速器等核心零部件和攝像頭、軸承等其他零部件;中游是人形機器人本體制造,包括主要模塊、內置的算法模型與系統、主要組成部分;下游是系統集成、產品銷售與維修保養。人形機器人的應用場景是家庭、工廠和商業等。
人形機器人產業鏈,來源:創業邦
核心技術拆解
人形機器人技術
人形機器人技術的技術分支很多,簡單講可以從兩個層面去理解::第一個層面可以分為 軟件和硬件 ,軟件是代碼和數據,硬件是所有看得見、摸得著的東西;第二個層面是按機器人身體部分去分,最主要的可大致分為 腦 、 手 和 腿 。
人形機器人關鍵技術分析,來源:元禾控股
雙足
人形機器人外觀看起來像人,很大一部分原因是因為它和人一樣有兩條腿。當前無論在科研領域還是業界都有大量的工作是在研究人形機器人雙足的運動能力:怎么走得穩?怎么跑得快?怎么能上樓?怎么能跑酷?
要做人形機器人的雙足控制基本來說有兩種方法:第一種是基于動力學、運動學的 傳統建模方法 ,這種方法的建模計算比較復雜,很多參數在現實環境中無法準確獲取。現在隨著深度學習的快速發展和廣泛應用,越來越多被雙足機器人領域采用的是第二種方法,即 深度強化學習算法 ,這種方法無需建模,可在仿真環境中大量部署進行訓練,隨數據擴增性能增強。此外,也有一些使用兩者結合的方法去做的。
雙足存在的必要性也是目前很有爭議的點,已經有不少人意識到,雙足不是必要的。2024年上半年推出的新型人形機器人中,雖然雙足機器人仍占據主流,但是選擇輪式底盤的機器人數量在逐漸增加。
實際上對比來看,輪式在 控制難度 、 成本 、 速度 、 故障率 、 安全性方面 都要優于足式,在工廠和家庭等多數環境中看不到雙足移動存在的必要性。
腦(決策)
大模型為機器人裝上“大腦”,提升其理解能力, 可提供決策 。目前,國內大模型市場競爭激烈,但“大模型+具身智能”還處于技術探索的初期階段,技術路線尚未收斂。語言大模型可以提供交互和決策,但是無法直接參與操作,就是在于靈巧手操作的問題沒有解決。
靈巧手
靈巧手操作很大程度上決定了機器人的應用場景和使用范圍。人手共有22個自由度,復雜而靈活。人形機器人的靈巧手是一種基于人手運動學設計的特殊末端執行器,目前絕大多數機械手無法完美復刻人手的功能。
靈巧手領域一個懸而未決的問題是 不確定用哪種結構 。靈巧手在實際應用中需要多少個自由度,是采用三指形態或者五指形態,是使用欠驅動或者全驅動的方案目前都尚無定論。目前人形機器人領域比較典型的靈巧手結構有以下三種:
一是夾爪形態,圖片所示是騰訊Robotics X研究院推出的產品,是一款三指夾手,其設計理念就是模仿了拇指、食指和中指,因為實際上人手的無名指和小指作用沒有那么大。好處是省出來的空間可以裝更多的電機,讓它更靈活,它有8個自由度。
第二種是目前用的最多的6自由度仿人手機械手,如圖所示是因時機器人的產品。這種手的優點是電機內置,既保留了人手的形態又比較輕便,缺點是靈活度不高,除拇指外四指都采用欠驅動方案,兩個關節只有一個驅動器。
最后一種是最靈活的一種,就是全驅動靈巧手。典型代表就是Shadow hand,它有超過20個自由度,設計復雜,跟人手一樣,目前在一些靈巧操作的研究工作中使用率很高。但這種手的問題是驅動器數量多且外置,重量和體積都比較大,成本也比較高。
靈巧手操作控制
靈巧手的硬件結構決定了操作的上限,而控制決定了其實際操作能力。靈巧手操作也被稱為 人形機器人的最后一厘米 。目前在業界,甚至在科研領域,靈巧手操作能實現的功能還比較有限,并且多數僅在特定環境或仿真環境中有效,泛化性較差。
OpenAI在2019年利用強化學習在仿真環境中的訓練實現了機械手單手復原魔方,是靈巧手靈活操作方面非常杰出的工作。但OpenAI2021 年解散了機器人團隊,解散的理由是“數據不夠豐富”。
在需要數據支撐的學習類算法取得充分成功的今天,數據問題阻礙了人們在機器人技術方面的發展。當下的情況是,機器人數據規模遠遠無法與圖像和文字數據規模相比,而且機器人形態各異,數據往往需要針對特定的機器人類型。 數據缺乏 、 成本高 、 成功率低 ,是目前人形機器人訓練的三大痛點。
傳感器
傳感器負責機器人的感知輸入,類似人類的視覺、聽覺、嗅覺、觸覺等感覺。人形機器人需借助多種傳感器識別自身運動狀態和環境狀況,收集多模態數據以供交互。因為靈巧手操作的重要性,我們重點看一下跟操作直接相關的傳感器。
六維力矩傳感器 :力矩傳感器是一種用于測量物體所受到的力矩或扭矩的傳感器。六維力矩傳感器能感受六個維度的力,通常用在人形機器人手腕處,是性能最優、技術壁壘最高的力矩傳感器,但是成本較高,生產廠商主要分為歐美、日韓、國產三大陣營。
觸覺傳感器 :觸覺傳感器最常用的有一維壓力傳感器,其成本較低,使用方便,但實際使用中獲取信息單一,如無法獲取溫度、滑移等信息,對靈巧手的覆蓋范圍也有限,無法有效生成力分布數據。對很多靈巧操作來說,一維壓力傳感器的性能是不夠的。
視觸覺傳感器 :視觸覺傳感器是一類比較新的觸覺傳感器,它的原理是使用內部攝像頭采集傳感器接觸面的視覺信息來判斷接觸狀態。在科研界已經有很多相關研究,在一些最新的人形機器人樣機上也看到了視觸覺傳感器的應用。人類在操作物體的時候,手部的觸覺信息包含物體本身的狀態和接觸的狀態兩個維度,大多數觸覺傳感器比如壓阻式、壓電式、電容式和電磁式大都只能感受法向力,而對其他信息無法采集或靈敏度很低,視觸覺傳感器感知信息維度豐富,包括力分布、物體紋理、粗糙度、硬度等,且成本可控,對比傳統傳感器有優勢。
電機
電機的主要作用是產生驅動轉矩,是動力源。在靈巧手使用的空心杯電機一般指的是空心杯電機+多級行星減速箱組成的模組。空心杯電機份額仍然集中在海外廠商,國內外空心杯電機制造商在軟實力和硬實力均有一定差距,代表企業有瑞士MAXON、德國FAULHABER和瑞士PORTESCAP以及鳴志電器、鼎智科技、兆威機電、偉創電氣。
發展趨勢及投資分析
結合人形機器人行業目前發展的情況和核心技術的成熟度,我們首先從人形機器人的落地場景進行分析。
商業化落地場景
人形機器人的商業化落地場景,典型的有三個: 工業 、 商業 、 家庭 。
在工業上,早已經有了機器人的參與,工業機器人在物料搬運、焊接、裝配、掃地、分揀、加工等多種場景都已經成功應用。2022年我國工業機器人市場規模為87億美元,占到了我國機器人市場規模的一半,銷量為30.3萬臺,占全球工業機器人安裝量的一半。
需要注意的是,人形機器人的特點之一是通用性,但在工業環境下應用時,不可避免要走向專業化,兩者存在本質矛盾。在初期試探的時候可以使用人形機器人去做一些簡單的、專業化分工細致的工作,但當人形機器人在工廠落地大規模應用時,無可避免地要追求成本、效率,這時候注重通用性的人形機器人大概率無法與工業機器人或復合機器人相比。
另一個場景是商業,目前也有一些在商業上應用成功的機器人,常見的商用場景中,商用服務機器人主要分為終端配送類機器人、商用清潔類機器人、引導講解類機器人等,已經被廣泛應用在餐廳、酒店、娛樂商超等場所。然而,目前的商用服務機器人均不涉及需要操作的復雜場景,也不需要通過靈巧手與人進行互動。未來如果考慮人形機器人進入商業場景,那現有技術的穩定性和安全性還需要進行升級。
最后一個場景是家庭,家庭也是普通人最期待的人形機器人的應用環境,人們對人形機器人在家庭中的角色期待是可以做各種家務,照顧老人孩子等。但通過對最新的技術進行研究發現,目前針對家庭環境,即使在科研領域,人形機器人能實現的功能都非常有限。因為家庭環境不同于工廠環境,家庭環境的非結構化及復雜程度要更高,家庭中需要接觸的不規則物體和柔軟物體更多,且家庭中機器人難以避免直接與人接觸,這對機器人的安全性也提出嚴苛要求。
因此在未來的家庭環境中,我們覺得一個有潛力的方向是 軟體機器人 。與剛性機器人相比,軟體機器人在與人類的交互中更加安全、能夠更好地適應復雜和非結構化的環境、更容易處理軟和易碎的物體。實際上目前軟體夾爪在工業上已經成功應用,其他在康復領域也有應用,比如氣動的康復手套,軟體的康復外骨骼等。總之在需要和人體發生直接接觸的環境中,軟體機器人會是一個有優勢的方案。
人形機器人VS自動駕駛
現在一個常見的觀點是,人形機器人的發展,可以類比自動駕駛。一方面來說這個觀點是有道理的,汽車可以看作特殊場景的機器人,其可執行的自由度有三個:方向盤旋轉、兩個踏板的平移,是使用場景特別確定的簡化的機器人。我們看到自動駕駛產業經過近十余年的高速發展已經進入逐步泛化階段,高等自動駕駛正逐步落地,這會給人形機器人的發展帶來一定的信心。然而,對于目前流行的端到端自動駕駛來說,長尾數據問題依然沒有解決,這已經成為了制約自動駕駛發展的最大難題之一。
另一方面,人形機器人和自動駕駛又有明顯的區別,主要有以下幾點:
自動駕駛應用場景明確而單一,人形機器人應用場景未定且復雜。
自動駕駛需要控制的參數少,人形機器人需要控制的參數多得多。
自動駕駛需要的傳感器基本滿足使用,人形機器人的觸覺尚未解決。
自動駕駛未成熟時不影響其硬件(汽車)銷售,人形機器人大模型未成熟時硬件很難起量。
自動駕駛發展的中間階段使用可由人為介入規避風險,人形機器人則難以介入,增加了危險性。
自動駕駛硬件基本結構早已確定,人形機器人很多結構(靈巧手等)尚未確定。
自動駕駛過程為多次短期操作,機器人操作涉及長操作,誤差更容易積累。
所以,可以看到,自動駕駛可以看成場景確定、功能簡化的機器人控制,但是人形機器人的難度還是要明顯高于自動駕駛。
路徑分析
關于人形機器人應用的難點基本都會落在靈巧操作上,在現有技術環境下,要解決機器人操作的難題,大的路徑有兩種,一個是 基于模型的算法 ,一個是 基于學習類的算法 。
人形機器人發展路徑分析,來源:元禾控股
模型算法的問題是復雜、上限低,學習類算法的問題是數據依賴和黑盒。人工智能專家Rich Sutton在他的文章中說過,AI研究的歷史表明, 能夠隨著數據規模擴大而提升的算法總是勝過那些復雜卻無法隨數據規模擴大而提升的算法 。結合近年來學習類算法取得的成功,相信機器人操作問題的解決主要還是會依賴學習類算法,即建立機器人操作大模型這條路。
但要建立機器人操作大模型,目前的數據量和質量都是不夠的。這里包括兩種數據,真實數據和仿真數據,真實數據的數據量非常有限,要解決這個問題可以采集新數據或者去利用現存的其他數據。采集新數據無疑是最直接的方法,但是效率低下,且在目前機器人硬件未完全定型的情況下存在一定風險。利用其他現存的其他數據如可以使用視頻數據,但是目前也還在研究階段。仿真數據的難點是在使用時面臨Sim2real gap的問題,這是由仿真環境和真實環境的差距帶來的。面對一些較簡單的場景這個問題可以被解決,但是在泛化的環境中,尤其涉及軟物體操作時,目前還無法被有效仿真和遷移。可以看到機器人大模型的數據問題目前還沒有有效解決,將來成熟的方法也可能是多種數據類型和算法的組合。
中航證券研究所預測,2030年人形機器人累計需求有望達200萬臺,對應市場空間約5700億元。我們認為,這是偏樂觀的預測,結合人形機器人的技術成熟度、應用場景要求和發展邏輯來說,人形機器人未來很長一段時間 真正有效的市場僅限于科研 、 展覽 、 表演等環境 。
機器人市場規模預測,來源:中航證券研究所
總結
從行業來說:
-
在工廠環境下,人形機器人的通用性出發點和應用場景追求專業性(效率及成本)上存在根本矛盾,專業化要求下大概率機器人形態偏離人形。
-
在家庭環境中,人形機器人對軟物體的操作以及安全性將成為大問題,目前看很難有效解決。
-
雙足形態看不到存在的必要,輪式在速度、成本、安全性方面更具優勢。
-
靈巧手及傳感器決定了操作能力的天花板,是人形機器人能否真正實用的關鍵之一。
-
當下時代,數據成為人形機器人能否商業化的最重要因素。
-
人形機器人的核心要義是智能,而不是像人。
免責聲明:本文不構成任何投資建議,投資者不應以該等信息取代其獨立判斷或僅根據該等信息做出決策。我們盡可能保證本文信息準確可靠,但對其準確性或完整性不作保證,亦不對因使用該等信息而引發的損失承擔任何責任。
本文來自微信公眾號 “東沙湖基金小鎮” ,作者:元動力,36氪經授權發布。
- 新聞
- IT/互聯網
- 科研/技術服務
- 通信
- 軟件信息
- CIO
- CDO
- CFO
- CMO
- 智能制造
- 人工智能
- 研發
- IT
推薦
-
11月28日-30日,中國數字化年會將于成都正式開幕,本屆年會以數智萬象 無界新生”為主題,設置2場主論壇、1場高峰論壇、5場專題論壇、4項特色活動、2場頒獎典禮等14項活動,以及2天數字化轉型供需對接展。
-
零次方科技發布了其首款人形機器人,可以在多種不規則路面、復雜地形中長時間穩定行走,且具備優秀的抗干擾性能,即使受到各方向的強沖擊也能保持穩定站立。
-
近日,第四屆“青年科學家502論壇”在南方科技大學舉行,美國國家工程院外籍院士沈向洋做了《通用人工智能時代,我們應該怎樣思考大模型》的主題演講,并給出了他對大模型的10個思考。
-
深度解析Meta Reality Labs的生態布局
-
TeleAI 李學龍團隊提出具身世界模型
-
2024 年 10 月 14 日,第 44 屆中東海灣信息技術展(GITEX Global)在阿聯酋迪拜開幕。紫光股份旗下新華三集團重磅亮相展會,以"精耕務實,為時代賦智慧"為主題,全面展示了公司"云-網-安-算-存-端"的全棧技術能力與國際生態合作成果。
我要評論