 
2024 年,人形機器人領域迎來爆發式增長。特斯拉 Optimus 的持續迭代、OpenAI 對 1X 的戰略投資,眾多初創公司異軍突起,以及包括 Mobile ALOHA 在內學術界的不斷創新,共同描繪出一幅激動人心的未來圖景。
技術進步的浪潮固然令人振奮,但保持清醒和冷靜,在開放探索的基礎上,審慎選擇符合時代需求和技術發展規律的路徑,才是引領人形機器人走向成熟的關鍵。
本期機器之心《智者訪談》邀請到清華大學自動化系研究員、機器人控制實驗室主任趙明國教授,從運動控制的視角看人形機器人發展。趙明國教授在機器人控制領域有二十多年的研究與實踐,他認為當前人形機器人領域呈現出如春秋戰國般多元化的發展態勢,這既是蓬勃發展的象征,也潛藏著方向迷失的風險。

趙明國教授強調,「智能人形機器人」不能只是「智能」和「人形機器人」的簡單疊加,而應當是一個全新的研究主題和技術范疇,需要機器人學和人工智能兩個領域更深層次的融合,制造能夠在復雜環境中自主適應和學習的智能體。
對大模型技術在機器人控制領域的應用,趙教授認為單純依賴「大腦」解決運動控制問題并不合理。人類的運動控制是一個復雜的多層次系統,涉及本體反射、中樞控制和大腦控制等多個層面。我們需要更深入地研究生物系統的運動控制機理,重新思考機器人控制系統的架構,并探索更有效的學習和優化方法。
趙教授主張技術的先進性并不等同于實用性,只有與時代需求和經濟發展相匹配的技術,才能真正落地生根,開花結果。例如,維納控制論中的很多思想因為過于超前而未能對早期的計算機和人工智能起到重大的推動作用。
那么,究竟什么樣的技術路線才能終勝出?人形機器人的未來又將如何演變?點擊觀看視頻,讓我們一同探索。
訪談文字整理
機器之心:趙明國教授好,非常高興您做客機器之心的《智者訪談》。近年來,隨著具身智能和大語言模型的迅速發展,公眾對于如何實現智能機器人的討論熱度空前。今天我們很高興能與您從運動控制的視角探討人形機器人的發展前景。
談及人形機器人,人們往往會聯想到幾家著名企業,比如專注于機器人運動控制和硬件設計的波士頓動力,以及憑借在人工智能和大數據方面的優勢進軍人形機器人領域的特斯拉。
趙明國:事實上,在波士頓動力之前,日本本田公司就已經在人形機器人領域做出了開創性的貢獻。波士頓動力主要專注于提升機器人的運動控制能力,而特斯拉則依托其在自動駕駛技術和先進器件方面的優勢,更多從制造業和供應鏈的角度切入,為人形機器人的發展帶來了全新的思路。這種方法讓許多人認為,如果未來機器人要實現大規模應用,特斯拉的路線可能更符合當前技術發展的趨勢,因此也有不少企業選擇追隨特斯拉的發展路徑。
然而,這并不意味著波士頓動力或本田的技術路線就失去了重要性。我認為這些不同路線都有其價值,因為技術的進步是一個漸進的過程,需要一代又一代的積累和發展。除了企業的努力,學術界也在不斷提出新的理論和方法。目前,許多公司,包括一些創業團隊,正在嘗試將學術界的研究成果與本田、波士頓動力和特斯拉等公司的技術應用相結合,探索新的發展方向。
當前人形機器人領域的發展狀況,可以比作春秋戰國時期,雖然存在幾個主流的技術路線,但更多呈現出百花齊放的局面。
01、白馬非馬:智能人形機器人不只是
智能與人形機器人的簡單疊加
機器之心:眾所周知,運動控制是建立在明確的運動學和力學原理基礎之上,在數學和工程方面具有嚴謹性。相比之下,人工智能具備自適應和自學習能力,尤其在處理復雜問題時,AI 常能發現人類難以想到的解決方案。然而,這種特性也帶來了可解釋性的挑戰。
波士頓動力的機器人在運動控制方面表現卓越,同時也展現了高度的智能。例如,配備機械臂的 Spot 機器人在物體識別和抓取方面表現出色。另一方面,以 AI 技術見長的特斯拉在硬件領域也投入了大量資源。您一直強調將運動控制與人工智能相結合的重要性,在發展人形機器人方面,我們可以從這些公司的實踐中獲得哪些啟示?
趙明國:人形機器人與人工智能的結合可以采取多種方式。其中一種是兩個領域各自發展,然后將各自的優勢整合。但除此之外,還存在其他途徑。以波士頓動力為例,他們曾強調專注于運動控制而不涉足人工智能,但實際上他們也運用了一些智能的方法。不過,他們的核心在于解決運動控制問題,如行走、奔跑和跳躍等,只不過在解決這些問題時,他們采用的方法可以是傳統的運動控制技術,也可以是智能的方法。
同樣,專注于人工智能的公司在解決智能問題時,也會使用機器人作為載體。例如,進行對話交互時,可以選擇人形機器人,也可以選擇智能音箱,這對智能本身的影響并不顯著,核心問題在于能否實現順暢的人機交互。
然而,要將人工智能與人形機器人真正深度融合,就像「白馬非馬」這個哲學命題一樣,需要創造出一個全新的事物。智能人形機器人必然不同于傳統意義上的智能系統,也不同于常規的人形機器人,而是一個更深層次融合后的獨立存在。
我認為「具身智能」這個概念較為貼合這種場景。在這種情況下,我們期望機器人能展現出行為層面的智能,不僅能夠在各種復雜地形上行走,還能在面對干擾時完成任務,表現出智能化的行為。例如,機器人應該能夠避開障礙物,在動態環境中規劃路徑,比如開門這個典型案例,包括應對不同形狀、不同類型的門,同時能制定策略繞過中間的障礙物,或者在有其他人同時開門時做出規避或讓步等行為。在手部操作方面,這樣的例子更為豐富,因為人類大部分操作都是通過手來完成的。
這是一個全新的研究主題——如何讓機器人展現智能。這需要機器人學和人工智能兩個領域進行更深層次的融合,而不僅僅是一個領域借用另一個領域的技術來提升自身。我們需要將兩者有機結合,創造出一個全新的技術范疇。
機器之心:您的觀點非常具有啟發性,但似乎目前很少有人從這個角度來探討這個問題。
趙明國:這實際上取決于不同的視角,我只是試圖將問題闡述得更加清晰。無論采用何種方法,要開發出這種新型機器人,我們需要考慮幾個關鍵。
首先是腿部的智能;其次是手部的智能,包括手指和手臂的智能,手臂負責運動,手指負責實際的抓取和操作。在進行手部操作時,腿部通常也在運動,這需要手足協調。除此之外,還有一些全身性的智能,如騎自行車、攀巖,以及前面提到的開門,這些活動強調全身的協調。從運動能力的角度來看,有些智能機器人可能更側重于腿部功能,有些更注重手部功能,還有一些可能側重全身運動,也可能是這三個領域的不同組合。
在早期階段,我認為可以為這三個領域分別選取一些典型案例作為代表,用它們來推動技術發展,并作為標準測試平臺。如果一個機器人能夠完成特定任務,就意味著相關技術已經取得突破,能夠實現某些功能了。我們可以從一個領域開始,逐步擴展到兩個,終實現三個領域的突破,然后再考慮實際應用。
當然,也有團隊選擇直接從應用需求出發,通過反向推導來進行開發。目前業界還沒有形成共識,各種方法都有人在嘗試。但從基本的邏輯看,無非就是這三個領域的不同組合。
