4月19日,北京亦莊賽道上,齊天大圣隊的“閃電”機器人以50分26秒凈用時率先沖線,不僅奪得2026人形機器人半程馬拉松冠軍,更以超越人類半馬世界紀錄(56分42秒)的成績,將這場賽事推向前所未有的高度。
僅僅一年前,同一賽道上還是機器人大面積踉蹌摔倒的“社死現(xiàn)場”;而今年,超百支賽隊、300余臺機器人同臺競技,參賽規(guī)模較2025年增長近5倍。這些數(shù)字上的躍遷,究竟意味著什么?
“2025年更多是在證明人形機器人可以參與長距離運動,而2026年開始在回答這種能力是否具備工程上的可靠性?!眾W比中光泛機器人產(chǎn)品中心產(chǎn)品總監(jiān)李威這樣概括兩屆賽事的本質(zhì)差異。
在李威看來,問題的重心已經(jīng)從“能不能走”轉(zhuǎn)移到了感知系統(tǒng)的穩(wěn)定性、環(huán)境理解能力和系統(tǒng)長時間運行的魯棒性。今年參賽機器人數(shù)量大幅增長,各家廠商在統(tǒng)一規(guī)則、更接近真實世界的環(huán)境下接受集中檢驗,賽事事實上演變成了一個具有高可比性的行業(yè)測試場,倒逼行業(yè)加速技術(shù)競爭與自我迭代。
面對外界關(guān)于“人形機器人是否實用”的持續(xù)爭議,李威的判斷是,這不過是技術(shù)從實驗室走向現(xiàn)實世界的必經(jīng)階段?!盃幾h往往源于對現(xiàn)狀的審視,而價值產(chǎn)生于對未來的工程化推進?!睆耐曩惵实拇蠓嵘瑑H一年時間這種從“蹣跚學步”到“穩(wěn)健奔跑”的質(zhì)變,在他看來已足以說明中國人形機器人產(chǎn)業(yè)的發(fā)展速度。
奧比中光對人形機器人的落地路徑有一套“分層推進”的判斷框架。第一層是已然實現(xiàn)的單點能力落地,在限定環(huán)境執(zhí)行指定任務(wù),變量可控,例如簡單搬運、固定路線巡檢;第二層是正在發(fā)生的場景級落地,環(huán)境不再完全可控,任務(wù)有一定變化,考驗機器人對環(huán)境變化的適應(yīng)能力;第三層則是未來的通用落地,能夠在高度不確定的環(huán)境下解決多場景多任務(wù)的通用具身智能問題。
業(yè)內(nèi)認為,當前行業(yè)整體處于第二層向第三層過渡的關(guān)鍵節(jié)點,能否跨越這道門檻,很大程度上取決于感知技術(shù)的突破。
從感知角度來看,李威認為人形機器人當前面臨三重技術(shù)瓶頸。其一是長時運行下的“穩(wěn)定性赤字”,短時演示可以掩蓋系統(tǒng)性缺陷,但一旦進入長時間運行,感知數(shù)據(jù)是否持續(xù)可靠、系統(tǒng)是否累積誤差等問題就會徹底暴露,視覺感知需要在幾十分鐘乃至更長時間內(nèi)持續(xù)穩(wěn)定輸出高質(zhì)量深度信息。二是復雜多場景的“泛化困局”,機器人走出實驗室后必須應(yīng)對強光、逆光、戶外復雜材質(zhì)及動態(tài)遮擋等不可控變量,這要求極高的環(huán)境理解與實時調(diào)整能力。三是感知與運動的耦合難題,在長距離運動中,機器人自身的振動、視角切換和動態(tài)模糊會反作用于感知精度,如何在運動狀態(tài)下維持感知穩(wěn)定性,是目前亟待解決的工程問題。
在這一系統(tǒng)架構(gòu)中,3D視覺處于“感知、決策、執(zhí)行”鏈條的最前端,其角色舉足輕重。李威以馬拉松賽道為例,如果視覺系統(tǒng)無法準確識別下坡斜度或起伏路面,機器人即便擁有再強大的運動平衡算法,也會因“信息失真”導致執(zhí)行失效。
未來方向上,奧比中光判斷3D視覺將沿幾條主線演進。一是精度與穩(wěn)定性并重,“能不能一直穩(wěn)定工作”與“某一刻測得準”同等重要,未來模組必須具備極高的抗震動、抗干擾能力;二是從單一傳感走向RGB圖像、深度數(shù)據(jù)與AI語義理解的多模態(tài)深度融合,讓視覺系統(tǒng)不僅能看到前方有障礙,還能理解那是什么性質(zhì)的障礙;三是從室內(nèi)受控環(huán)境向戶外、工業(yè)、非結(jié)構(gòu)化場景全面延伸;四是在保持高性能輸出的同時實現(xiàn)功耗與體積的極致壓縮,這是量產(chǎn)落地的先決條件。
目前,奧比中光已推出面向機器人場景的Gemini 330系列雙目3D相機,搭載自研深度引擎芯片MX6800,可在從漆黑到強光的各類光照條件下輸出精準三維數(shù)據(jù),并實現(xiàn)極低的數(shù)據(jù)傳輸時延。該系列產(chǎn)品已落地天工、智元、優(yōu)必選、榮耀、星塵智能等多個人形機器人平臺。