版權(quán)歸原作者所有,如有侵權(quán),請聯(lián)系我們

暗黑廚房里的機械共舞,人形機器人如何從科幻走進現(xiàn)實?

蝌蚪五線譜
原創(chuàng)
專注做權(quán)威、有趣、貼近生活的互聯(lián)網(wǎng)科學傳播
收藏

image.png

Figure機器人(圖源:Figure)

在科幻電影的預(yù)言中,人類與機器人的共生總是始于一場靜默的革命——那些曾經(jīng)笨拙的機械臂開始像人類一樣思考,冰冷的金屬關(guān)節(jié)學會與生活場景共舞。而2025年2月,這一幕似乎悄然在現(xiàn)實中上演。

美國初創(chuàng)公司Figure推出的新一代人形機器人,搭載了名為Helix的視覺-語言-動作(VLA)模型,極大增強了機器人的感知、控制、理解能力,讓兩臺機器人無需預(yù)演便能默契傳遞物品,以近乎科幻的智能協(xié)作能力,將家庭場景中的機械管家從幻想拉入現(xiàn)實。

人形機器人:科技的集大成者

image.png

電影《大都會(Metropolis)》劇照

機器人(Robot)的概念,最早出現(xiàn)在捷克著名作家卡雷爾·恰佩克(Karel ?apek)于1920年創(chuàng)作的戲劇《羅素姆萬能機器人》中。1927年電影《大都會》中的人造人瑪麗亞,便以機械之軀承載人性,成為賽博朋克美學的早期雛形。

人形機器人(Humanoid Robot)是一種利用人工智能和機器人技術(shù)制造的具有類似人類外觀和行為的機器人,融合了機械工程、電子技術(shù)、計算機科學、人工智能等多學科領(lǐng)域的前沿成果。

image.png

NASA 的 Valkyrie (R5) 機器人

圖源:NASA

人形機器人的核心技術(shù)由四部分組成:

感知系統(tǒng):指人形機器人需要具備感知環(huán)境的能力,通過傳感器等設(shè)備來獲取外部信息,如視覺感知、聽覺感知、觸覺感知等。

智能決策:指通過機器學習、深度學習、神經(jīng)網(wǎng)絡(luò)等人工智能技術(shù),使機器人能夠根據(jù)情景和任務(wù)要求自主決策和判斷。

人機交互:指人形機器人能夠更好地與人類進行交流和互動的功能,如語言識別、情感識別等。

運動控制:指通過使用各種傳感器和算法來對機器人進行姿勢控制、步態(tài)規(guī)劃和平衡控制。

人形機器人的發(fā)展史,是一部人類試圖用機械復刻自身的史詩。從蒸汽時代的齒輪幻想,到AI時代的神經(jīng)網(wǎng)絡(luò)革命,每個技術(shù)節(jié)點的突破都暗合著科幻作品的預(yù)言與啟示。

01

早期發(fā)展階段(1970s-2000):

早期的人形機器人模型外表簡略,僅僅具有初級的人類軀干與肢體形狀,能實行的功能也存在很大局限性,只能實現(xiàn)簡單的行走和手部運動,尚未具備交互能力且智能化水平較低。

image.png

WABOT-1機器人(圖源:早稻田大學)

例如1973年,日本早稻田大學研發(fā)出了世界上第一款人形機器人WABOT-1,它只能夠執(zhí)行搬運物體等任務(wù),智力水平相當于一歲半的嬰兒;同時期日本本田公司研發(fā)的自主行走機器人P2和ASIMO也僅僅在行走和平衡方面進行不斷優(yōu)化。

02

高度集成發(fā)展階段(2001-2011):

這一階段是人形機器人初級感知功能的起步階段。這一時期的人形機器人因技術(shù)的突破可以實現(xiàn)與外界環(huán)境有限的互動,并且運動自由度提升。雖然應(yīng)用場景較為簡單,主要用于展覽和娛樂,但在運動控制和人機交互方面確實有很大進步。

image.png

本田機器人發(fā)展歷史與第三代ASIMO(圖源:本田Honda)

例如2003年索尼QRIO機器人配備了語音識別功能和人臉識別功能,能識別10種面部表情;2011年,日本本田推出的第三代ASIMO,其利用傳感器避開障礙物等自動判斷并行動的能力,還能用五根手指做手語,或?qū)⑺畨乩锏乃谷爰埍?;ASIMO不僅能上下樓梯、端茶倒水,還曾在2014年指揮底特律交響樂團。

03

高動態(tài)運動與交互能力提升階段

(2012-2020):

該階段的研發(fā)重點放在強化人形機器人的運動能力或交互能力上。強化學習技術(shù)讓人形機器人在與環(huán)境的交互中不斷優(yōu)化動作和行為,情感識別和語言交互技術(shù)也得到顯著提升。

image.png

POPPY機器人發(fā)展歷史(圖源:Inria)

例如,2013年美國波士頓動力公司研發(fā)的雙足人形機器人Atlas具有超高的運動能力,可以熟練地完成垂直起跳、倒立、跨越障礙、后空翻,甚至和Spot機器人一起舞蹈,具有手腳都參與的跑酷功能。

2016 年法國 Inria Flower 實驗室開發(fā)的第一款開源人形機器人 POPPY 上市,它在教育、科研、文化藝術(shù)等多個領(lǐng)域都展現(xiàn)出出色的適應(yīng)能力。在教育領(lǐng)域,POPPY 可以作為教學工具,幫助學生更直觀地理解機器人原理和編程知識;在文化藝術(shù)創(chuàng)作中,藝術(shù)家們借助 POPPY 的獨特表現(xiàn)力,創(chuàng)作出許多新穎的藝術(shù)作品。

04

高度智能化發(fā)展階段(2020至今):

借助現(xiàn)代人工智能、計算機視覺系統(tǒng)等先進技術(shù),人形機器人邁向智能化進階之路。如今的人形機器人的感知與認知能力大大增強,大多具有高度仿生的軀干構(gòu)型和擬人的運動控制,在重量、靈活性等方面都有顯著進步,實用性大大增強。

image.png

Ameca機器人發(fā)展歷史(圖源:Engineered Arts)

例如,英國 Engineered Arts 為 Ameca 接入 GPT-3/4 后,它如獲新生。Ameca 配備了高級傳感器,具備面部和多種語音識別功能,可以自然地與人類互動,不僅能敏銳檢測人類情緒,還能通過豐富的表情和手勢傳達信息。

在一些高端科技體驗場所,Ameca 作為接待員,以親切的交流和互動為訪客提供服務(wù),給人留下深刻印象。特斯拉公司的Optimus Gen2人形機器人的移動功能、靈巧性、平衡性和實時處理方面的功能也因為AI大模型的介入得到了顯著提升。

image.png

Unitree H1機器人(圖源:宇樹科技)

雖然國內(nèi)人形機器人的發(fā)展起步較晚,上個世紀90年代才開始研究。但近年來,國內(nèi)人形機器人研發(fā)取得了顯著進展,眾多企業(yè)和科研機構(gòu)積極投身其中,在技術(shù)創(chuàng)新和產(chǎn)品應(yīng)用方面不斷探索。宇樹科技便是國內(nèi)人形機器人領(lǐng)域的佼佼者。

在春晚舞臺上,宇樹科技的16臺人形機器人Unitree H1與舞蹈演員共同演繹《秧BOT》,以“賽博秧歌”驚艷全場。這些機器人擁有19個關(guān)節(jié),手臂額外增加3個自由度,實現(xiàn)了手絹旋轉(zhuǎn)、拋擲回收等高難度動作。

這支名為《秧BOT》的舞蹈背后,是19個關(guān)節(jié)的精密協(xié)同,是每幀動作的AI映射,更是雙足機器人在復雜動態(tài)平衡領(lǐng)域的突破性進展,充分展現(xiàn)了宇樹科技在人形機器人研發(fā)方面的深厚實力。

人形機器人的發(fā)展前景令人充滿期待。隨著人工智能、材料科學、傳感器技術(shù)等領(lǐng)域的持續(xù)創(chuàng)新突破,人形機器人將變得更加智能、靈活和強大。

在智能水平方面,它們將具備更強大的學習能力和推理能力,能夠理解和處理更加復雜的任務(wù)和情境。通過與物聯(lián)網(wǎng)、大數(shù)據(jù)等技術(shù)的深度融合,人形機器人可以實時獲取和分析海量數(shù)據(jù),實現(xiàn)更精準的決策和更高效的行動。

在運動能力上,新型材料和機械設(shè)計將使人形機器人的動作更加流暢、自然,能夠適應(yīng)各種復雜的地形和環(huán)境,完成更多高難度的動作。

image.png

Figure機器人(圖源:Figure)

隨著人形機器人技術(shù)的不斷成熟,其應(yīng)用場景也日益廣泛。在工業(yè)領(lǐng)域,它們可以承擔一些危險、重復或高精度的工作;在醫(yī)療領(lǐng)域,人形機器人可協(xié)助醫(yī)生進行手術(shù),憑借其高精度的操作能力,降低手術(shù)風險;在家庭服務(wù)方面,人形機器人可以擔當家務(wù)助手,掃地、擦窗、洗碗等家務(wù)都能輕松完成;在教育領(lǐng)域,人形機器人作為創(chuàng)新的教學工具,能夠以生動有趣的方式傳授知識。

由此可見,人形機器人未來潛力巨大,不過仍面臨多種挑戰(zhàn)。

1.高算力:人形機器人的姿態(tài)、速度和力度等方面,都需要高算力,現(xiàn)階段的計算能力面臨巨大挑戰(zhàn)。

2.弱技術(shù):現(xiàn)在基礎(chǔ)技術(shù)能力仍然很弱,現(xiàn)有的軟件算法等不足以支撐人形機器人的大規(guī)模應(yīng)用,仍需技術(shù)大幅創(chuàng)新。

3.高成本:研發(fā)成本高昂,高額虧損、研發(fā)投入高,是人形機器人行業(yè)的常態(tài)。

4.不安全:數(shù)據(jù)安全能力和體系均存在不足,面臨安全隱私等問題。

image.png

游戲《底特律:化身為人(Detroit: Become Human)》主角康納

從WABOT-1的簡單動作到Ameca的自由互動,人形機器人正以“科技奇跡”之姿步入日常生活。它們既是《2001太空漫游》中HAL 9000的進化版,也是《底特律:變?nèi)恕分锌导{的原型。但技術(shù)的終極目標并非取代人類,而是如《星際穿越》中的TARS一般,成為探索未知的協(xié)作伙伴。

未來,當人形機器人真正融入社會時,人類或?qū)⒅匦露x“人性”——不是以生物學特征為界限,而是以創(chuàng)造力、同理心與倫理選擇為標尺。

或許正如所有經(jīng)典科幻的警示寓言,人形機器人終將成為照見人類本質(zhì)的鏡子:當它們學會在遞出蘋果時調(diào)整指尖力度以防磕碰,我們是否能以同等溫柔對待同類?當它們突破圖靈測試的瞬間,人類引以為傲的 “意識” 疆域又該如何重新勘定?

答案或許藏在下個十年的實驗室里,也可能早已寫在艾西莫夫的機器人定律與《仿生人會夢見電子羊嗎》的雨夜獨白中。唯一確定的是,這場機械覺醒的終章,注定由人類文明與機器智能共同書寫。

參考資料:

https://www.ccidgroup.com/info/1207/41123.htm

https://www.hanspub.org/journal/paperinformation?paperid=86460

https://www.figure.ai/news/helix

https://en.wikipedia.org/wiki/Atlas_(robot)

https://builtin.com/robotics/humanoid-robots

https://en.wikipedia.org/wiki/Humanoid_robot作者:楊雨鑫

策劃:劉穎 張超 李培元 楊柳

審核:付昌義 南京工業(yè)大學副教授

江蘇省科普作家協(xié)會科幻專委會主任委員

評論
傳承解惑
大學士級
隨著人工智能、材料科學、傳感器技術(shù)等領(lǐng)域的持續(xù)創(chuàng)新突破,人形機器人將變得更加智能、靈活和強大,人形機器人的發(fā)展前景令人充滿期待。
2025-03-03
無為通達
少傅級
人形機器人已經(jīng)從科幻走向了現(xiàn)實,并在各個領(lǐng)域發(fā)揮著重要作用。未來,隨著技術(shù)的不斷進步和應(yīng)用場景的不斷拓展,人形機器人將為人類社會的發(fā)展帶來更加深遠的影響。
2025-03-03
尖刀情懷永遠跟黨走
大學士級
機器人從科幻走進人們的視野,也走進人們的生活。廚房機器人的視覺不只是光線,而是感知電子元件,即使是昏暗的廚房,它們也能準確操作無誤,真的是科技提升了我們的生活水平和質(zhì)量!
2025-03-03