車企招了一批「鋼鐵實習(xí)生」,它們是人形機器人進入現(xiàn)實的關(guān)鍵
2024-08-26
來源:極客公園
作者 | 黎詩韻
編輯 | 靖宇
人形機器人不是新事物,但它的熱潮在兩年前再次被喚起,隨著特斯拉發(fā)布人形機器人 Optimus、以及 ChatGPT 的出現(xiàn),整個行業(yè)爆發(fā)出巨大的想象力。技術(shù)上,它意味著人形機器人可以擁有真正智能的大腦,進化成有自主感知決策執(zhí)行能力的智能體。而商業(yè)上,更智能的人形機器人可能會形成全新的生產(chǎn)力供給,為工業(yè)、家庭等場景帶來萬億美元規(guī)模的產(chǎn)值。 特斯拉的 Optimus 最大的目標是服務(wù)特斯拉的汽車產(chǎn)線,這也是眾多人形機器人公司在發(fā)力的方向。今年 3 月,人形機器人公司 Apptronik 與奔馳工廠合作;8 月,OpenAI 扶持的人形機器人公司 Figure 繼續(xù)加深與寶馬工廠合作。
而和前幾次技術(shù)革命不同,中國企業(yè)在這一進程上并不落后。
在正在舉行的 2024 世界機器人大會上,優(yōu)必選發(fā)布了全球首個面向多任務(wù)工業(yè)場景的通用人形機器人解決方案,把人形機器人在工廠的實訓(xùn)成果直接搬到了現(xiàn)場,讓觀眾現(xiàn)場觀摩人形機器人在工廠執(zhí)行質(zhì)檢、分揀和搬運的任務(wù)。
大會現(xiàn)場,優(yōu)必選還與奧迪一汽和北京具身智能機器人創(chuàng)新中心簽署合作協(xié)議,三方會共同研發(fā)人形機器人智能化解決方案,將人形機器人引入汽車產(chǎn)線的智能搬運、質(zhì)量檢查和過程材料操作等工位,推動人形機器人在汽車工廠的大規(guī)模應(yīng)用。
北京具身智能機器人創(chuàng)新中心總經(jīng)理熊友軍、奧迪一汽工程技術(shù)部部長利貝克·托比亞斯、優(yōu)必選首席品牌官譚旻分別代表三方簽署合作協(xié)議
奧迪一汽也成為繼吉利汽車、東風(fēng)柳汽、一汽-大眾青島分公司、一汽紅旗之后,又一家和優(yōu)必選達成合作的車企。目前,優(yōu)必選是全球范圍內(nèi)合作車企數(shù)量最多的人形機器人企業(yè),而除了車企之外,與優(yōu)必選達成合作的企業(yè)還包括了全球最大的精密電子制造商富士康,以及全球第四大的綜合物流服務(wù)提供商順豐。
在這套解決方案下,優(yōu)必選先為人形機器人在工廠應(yīng)用規(guī)劃了搬運、質(zhì)檢、分揀、螺絲擰緊、零件安裝、過程材料操作 6 大任務(wù)。目前,工業(yè)版 人形機器人 Walker S 系列已經(jīng)進入多家車廠實訓(xùn),車企付一定費用,人形機器人會通過大約 12-24 個月的實訓(xùn)不斷驗證產(chǎn)品性能。
這意味著,中國人形機器人行業(yè)在走入市場驗證(POC,Proof of Concept)階段,雖然距離想象中人形機器人在工業(yè)場景的真正通用、以及商業(yè)化落地,還有一定距離。但優(yōu)必選的選擇似乎表明,在人形機器人相關(guān)技術(shù)還未成熟的今天,通過對客戶需求和使用場景的了解和掌握,現(xiàn)有技術(shù)依然可以滿足工業(yè)場景最細小的需求、形成最小的 TPF(技術(shù)產(chǎn)品匹配)。
雖然距離想象中人形機器人在工業(yè)場景的真正通用、以及商業(yè)化落地,還有一定距離。但優(yōu)必選的選擇似乎表明,在人形機器人相關(guān)技術(shù)還未成熟的今天,通過對客戶需求和使用場景的了解和掌握,現(xiàn)有技術(shù)依然可以滿足工業(yè)場景最細小的需求、形成最小的 TPF(技術(shù)產(chǎn)品匹配)。談及人形機器人星辰大海的未來,有人認為在實驗室里研發(fā)一個通用具身大模型是關(guān)鍵。但優(yōu)必選認為,盡可能地把人形機器人安排到真實應(yīng)用場景里,先把一個垂直細分場景做好,再拓展到其它更多領(lǐng)域,這也許是打造一個通用人形機器人的最終答案。
01 車企需要人形機器人
如果說大模型是技術(shù)取得了突破之后、企業(yè)急著去找應(yīng)用場景,那人形機器人則是在技術(shù)不斷迭代的同時,市場的需求就已經(jīng)很強烈。這也要求人形機器人企業(yè)需要真實地了解市場的真實需求,利用已有技術(shù)布局來針對真實需求進行功能研發(fā)。
事實上,優(yōu)必選提出這個工業(yè)解決方案的起點,并不是它想落地人形機器人技術(shù)、于是找車企合作。恰恰相反,正是汽車企業(yè)有了強烈的需求,于是找到優(yōu)必選看、問是否能為其工業(yè)場景提供人形機器人。
這背后反映了汽車行業(yè)對人形機器人強烈、真實的市場需求。
汽車制造分為沖壓、焊接、涂裝和總裝四大工藝,其中前三個環(huán)節(jié)幾乎 90% 以上都由傳統(tǒng)自動化設(shè)備,如機械臂、協(xié)作臂或 AGV(自動導(dǎo)引車)等完成。但在總裝環(huán)節(jié),由于工藝相對非結(jié)構(gòu)化、復(fù)雜,其自動化率只有 20% 左右、終究離不開人工,車企招工難、成本高。
比如非結(jié)構(gòu)性的搬運場景,工人整天要搬十幾斤重的箱子,不僅枯燥、而且對身體有損傷,崗位很難招人。又比如非結(jié)構(gòu)性的涂料場景,工作環(huán)境有高輻射、高粉塵、甚至有害化學(xué)物品,招人同樣困難。
「大家可能想象不到,一些領(lǐng)先的新能源汽車生產(chǎn)商即便有數(shù)十萬甚至上百萬的工人,但是依然長期處于不滿工的狀態(tài)。車廠工人的流動性實際上非常高。」優(yōu)必選副總裁、研究院執(zhí)行院長焦繼超表示。
在這些場景中,能像「人」一樣干活的人形機器人是急需的。傳統(tǒng)的機械臂、簡單機器人往往只能完成給定的、被規(guī)劃好的任務(wù)。 而人形機器人或具身智能的定義是,其可以自主決策、規(guī)劃、執(zhí)行,像人一樣行動——而其技術(shù)成熟度越高,通用性、泛化性就越強,越能在不同場景、任務(wù)中切換,最終降低服務(wù)成本。
今年以來,焦繼超帶著研發(fā)團隊走訪了接近 20 家車企,并與車企研究院和產(chǎn)線的負責(zé)人進行了深度、持續(xù)的溝通。通過這些調(diào)研,他與團隊梳理出了大家的一些共同需求,以及車企對于人形機器人的能力要求。
最終,優(yōu)必選得出了車企對于人形機器人的幾個基本能力要求,包括要有足夠的自主能力、靈巧操作能力、穩(wěn)定可靠性等。基于這些要求以及目前已有的技術(shù)邊界,優(yōu)必選最終選中了幾項任務(wù)來開啟人形機器人在車廠中的實訓(xùn),包括第一階段的搬運、質(zhì)檢、分揀,之后,他們還計劃將實訓(xùn)任務(wù)拓展到螺絲擰緊、零件安裝、過程材料操作等。
優(yōu)必選人形機器人演示搬運動作|圖片來源:優(yōu)必選
盡管人形機器人領(lǐng)域的基礎(chǔ)具身大模型(一般指 VLA 視覺語言動作模型,和基礎(chǔ)語言大模型不同,它輸出的是動作)尚未有根本的技術(shù)突破,但在焦繼超看來,這并不十分重要。 「在工業(yè)里面我不是一定要跑個底座大模型,你可以理解為訓(xùn)個小模型就可以實現(xiàn)了。」他說。
給人形機器人做訓(xùn)練,實際上就是讓它在跟真實世界的交互中,提升它自主感知決策執(zhí)行的能力。
目前,主流的訓(xùn)練路徑分為兩種,一是大模型加小模型,即大模型作為「大腦」負責(zé)多模態(tài)感知、理解、規(guī)劃,而小模型作為「小腦」執(zhí)行,包括步態(tài)和靈巧操作等,這一方式已超過部分通用大模型的表現(xiàn)。另一種方式是端到端,即通過海量的數(shù)據(jù)訓(xùn)練,讓人形機器人看到數(shù)據(jù)就能輸出執(zhí)行,但這種訓(xùn)練方式更難捉摸。
人形機器人的訓(xùn)練路徑 | 圖片來源:優(yōu)必選
優(yōu)必選表示,目前在工業(yè)場景領(lǐng)域,主要還是采用大模型加小模型的技術(shù)路線,因為其訓(xùn)練效率更好。不過它也在做端到端的嘗試,未來面向更通用的場景,端到端的路線也許會是更好的選擇。
以搬運場景為例,大模型先感知環(huán)境,判斷料箱的大小和重量、搬運點的位置等,接著進行路徑規(guī)劃,下命令給電機,要求調(diào)整相應(yīng)的力度進行抓取,重的貨物用大力、輕的貨物用小力,最終實現(xiàn)搬運。
在這樣的訓(xùn)練框架下,優(yōu)必選讓人形機器人在搬運、分揀、質(zhì)檢等任務(wù)上初步驗證了可行性。過去,這種之前只能由人類完成的工作,現(xiàn)在都可以由人形機器人完成。
通過智能化的能力,人形機器人執(zhí)行這些任務(wù)時還具有一定的通用性、泛化性。以擰螺絲為例,人形機器人在 A 公司學(xué)會了擰螺絲,而切換到 B 公司、螺絲的型號和尺寸發(fā)生變化,機器人適配的成本很低、可以做到迅速部署。
在焦繼超看來,目前這個階段的任務(wù)在于,通過人形機器人在多個真實應(yīng)用場景中的數(shù)據(jù)反饋,不斷進行產(chǎn)品的驗證、優(yōu)化,為之后實現(xiàn)人形機器人在工業(yè)場景的大規(guī)模商用打下基礎(chǔ),「到時候我們把人形機器人交給客戶,它們可以直接拿它當(dāng)工人用。」他說。
02 人形機器人不是一上來就通用, 而是場景由點及面地通用
在工業(yè)場景的應(yīng)用落地上,優(yōu)必選確實覺得自己有一種「急迫感」。這倒主要不是出于商業(yè)化的考慮,作為一家成立了 12 年的人形機器人公司,優(yōu)必選這些年已經(jīng)探索出了一條成熟的自我供血路徑——一條腿研發(fā)人形機器人,另一條腿則將相關(guān)技術(shù)「沿途下蛋」,它最重要的收入來源是 AI 教育、物流、康養(yǎng)等智能機器人服務(wù)。
在人形機器人這條腿上,現(xiàn)階段更重要的意義在于通過在真實場景的落地實訓(xùn),一是實現(xiàn)技術(shù)突破,保持技術(shù)領(lǐng)先性,二是爭取在細分場景實現(xiàn)應(yīng)用突破。
原因在于,目前制約人形機器人發(fā)展的核心要素是數(shù)據(jù)。大模型擁有海量的互聯(lián)網(wǎng)數(shù)據(jù),自動駕駛擁有海量的行車數(shù)據(jù),但人形機器人的訓(xùn)練數(shù)據(jù)則少之又少、采集困難、成本也高。
現(xiàn)在盡管目前一些公司提出,可以通過虛擬的仿真數(shù)據(jù)訓(xùn)練,但這條路也并未形成共識。比如焦繼超認為,單純的仿真數(shù)據(jù)只是換了信息表達的方式、并不能準確描述物理世界。最終,還是要依靠真實物理世界的數(shù)據(jù)、并在此基礎(chǔ)上形成仿真數(shù)據(jù),真實數(shù)據(jù)的占比至少需要 80%。
考慮到場景的采集是海量的、而采集的成本又是極高的,最合適的方式就是選一個細分場景,既能從技術(shù)上收集數(shù)據(jù)做訓(xùn)練、又能同時商業(yè)化。那么目前能跑通的這些細分工業(yè)場景,就是不錯的起步選擇。
「誰掌握了場景,誰就掌握了數(shù)據(jù)。誰掌握了數(shù)據(jù),誰就掌握了做出真正通用人形機器人的關(guān)鍵要素。」焦繼超表示。 在他看來,和大語言模型不同,機器人的大模型大概率不是一上來就通用,而是由點及面、慢慢實現(xiàn)通用。
談及率先能夠與多家車廠達成合作的原因,焦繼超總結(jié)為三點:
一是技術(shù)積累 。作為有 12 年歷史的人形機器人公司,優(yōu)必選在人形機器人全棧式技術(shù),包括硬件、軟件等方面都有更多積累。「實訓(xùn)一旦開始就是一兩年時間,如果車企對人形機器人公司的技術(shù)沒有足夠的認識和認可,大概率會認為這家公司做不成他們想要的方案,最終不會達成合作。」焦繼超表示。
二是對客戶真實需求的認識 。如果說很多初創(chuàng)公司仍需技術(shù)「秀肌肉」,優(yōu)必選已經(jīng)經(jīng)歷過了該階段,更關(guān)注客戶需求。畢竟在一個現(xiàn)實的工廠環(huán)境中,人形機器人最重要的能力是能不能干活。
三是穩(wěn)定可靠性 。早在 2021 年推出人形機器人 Walker X 時,優(yōu)必選就將它用于大型展館等場景,例如,在迪拜世博會中國館,Walker X 和熊貓機器人優(yōu)悠就穩(wěn)定服務(wù)了六個月。在中國科學(xué)技術(shù)館,Walker 也服務(wù)了超過兩年。這種穩(wěn)定服務(wù)的能力,對于車廠來說尤為重要。
從小到大、從垂直到通用,優(yōu)必選將人形機器人的應(yīng)用場景擴張分為三步:
一、今年底,從新能源汽車廠切入,在搬運和分揀等任務(wù)進行測試,持續(xù)穩(wěn)定性和可靠性,并實現(xiàn)小批量交付;
二、明年起,從車廠逐步擴展到更多的場景,并推動人形機器人完成中等難度任務(wù),提升產(chǎn)品性能,逐步實現(xiàn)規(guī)模商業(yè)化;
三、從 2028 年起,進一步拓展更復(fù)雜的任務(wù)場景,成為多任務(wù)通用性工業(yè)人形機器人。
人社部、工信部、教育部聯(lián)合發(fā)布的《制造業(yè)人工發(fā)展規(guī)劃指南》中給出的預(yù)測數(shù)據(jù)顯示,到 2025 年,中國制造業(yè)工業(yè)缺口將接近 3000 萬人,這也會是人形機器人的一個巨大的潛在市場。優(yōu)必選就表示,目前已收到來自車廠的 500 臺人形機器人意向訂單。他們認為,隨著人形機器人等技術(shù)的引入,工業(yè)場景會形成「721」的格局:70% 是傳統(tǒng)機械臂、20% 是人形機器人、10% 是人工。這 500 臺走入工廠的「鋼鐵實習(xí)生」,正是人形機器人成為那「20%」的第一步。
那時,制造業(yè)的用工短缺將不再是問題、成本也會進一步降低,我國先進制造的競爭優(yōu)勢也將繼續(xù)保持。而當(dāng)工業(yè)場景實現(xiàn)突破之后,人形機器人將向家庭場景進發(fā),這是所有公司的最終目標。
一位人形機器人創(chuàng)業(yè)者感慨道,從來沒有碰到過這樣一個時刻,國家的需求、市場的需求、技術(shù)的可行性,這三件事完美地聚焦在了當(dāng)下這個時間窗口,因此預(yù)示了一個龐大市場的到來。這也許正是優(yōu)必選等人形機器人公司,如此積極地投入、力圖搶占先機的原因。
- 推薦
- 新聞
- 觀點
- 制造
- IT/互聯(lián)網(wǎng)
- 軟件信息
- CIO
- CDO
- 數(shù)字經(jīng)濟
- 工業(yè)互聯(lián)網(wǎng)
- 智能制造
- 人工智能
- 戰(zhàn)略
- 研發(fā)
- 生產(chǎn)制造
- 運營
- 市場營銷
- 銷售
- 財務(wù)
- 人力資源
推薦
-
11月28日-30日,中國數(shù)字化年會將于成都正式開幕,本屆年會以數(shù)智萬象 無界新生”為主題,設(shè)置2場主論壇、1場高峰論壇、5場專題論壇、4項特色活動、2場頒獎典禮等14項活動,以及2天數(shù)字化轉(zhuǎn)型供需對接展。
-
零次方科技發(fā)布了其首款人形機器人,可以在多種不規(guī)則路面、復(fù)雜地形中長時間穩(wěn)定行走,且具備優(yōu)秀的抗干擾性能,即使受到各方向的強沖擊也能保持穩(wěn)定站立。
-
近日,第四屆“青年科學(xué)家502論壇”在南方科技大學(xué)舉行,美國國家工程院外籍院士沈向洋做了《通用人工智能時代,我們應(yīng)該怎樣思考大模型》的主題演講,并給出了他對大模型的10個思考。
-
深度解析Meta Reality Labs的生態(tài)布局
-
TeleAI 李學(xué)龍團隊提出具身世界模型
-
2024 年 10 月 14 日,第 44 屆中東海灣信息技術(shù)展(GITEX Global)在阿聯(lián)酋迪拜開幕。紫光股份旗下新華三集團重磅亮相展會,以"精耕務(wù)實,為時代賦智慧"為主題,全面展示了公司"云-網(wǎng)-安-算-存-端"的全棧技術(shù)能力與國際生態(tài)合作成果。
-
中關(guān)村大數(shù)據(jù)產(chǎn)業(yè)聯(lián)盟 顏陽-元宇宙產(chǎn)業(yè)的商業(yè)邏輯與技術(shù)壁壘研究
顏陽 中關(guān)村大數(shù)據(jù)產(chǎn)業(yè)聯(lián)盟副秘書長 ¥9.90 金錦囊免費
我要評論