97情色五月天,人妻的色诱伦理片,曰韩AV久久AV,99视频在线播放,久久国产黄色电影,999美女激情,婷婷AV一区二区三区,久草精品视频网站,操青青在线观看

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號安全和更好的產(chǎn)品體驗,強烈建議使用更快更安全的瀏覽器
此為臨時鏈接,僅用于文章預覽,將在時失效
機器人 正文
發(fā)私信給吳思夢
發(fā)送

0

銀河通用創(chuàng)始人王鶴:具身智能正邁向?qū)俚摹窤lphaGo時刻」與「ChatGPT時刻」 | ICRA 2026

本文作者: 吳思夢   2026-06-05 18:22 專題:ICRA 國際機器人與自動化會議
導語:具身智能正在敲開AGI的大門,全面引爆屬于通用機器人的第四次工業(yè)革命。
銀河通用創(chuàng)始人王鶴:具身智能正邁向?qū)俚摹窤lphaGo時刻」與「ChatGPT時刻」 | ICRA 2026
具身智能正在敲開AGI的大門,全面引爆屬于通用機器人的第四次工業(yè)革命。

    作者丨岑   峰

    編輯丨馬曉寧

                                                                                                               

2026年6月3日,國際機器人與自動化會議(ICRA 2026)在奧地利維也納進入正會的第二天。在這一天的“行業(yè)主題演講”環(huán)節(jié)(Industry Keynote Session),具身智能領域知名學者、銀河通用(Galbot)創(chuàng)始人和CTO王鶴發(fā)表了題為《Towards the AlphaGo and ChatGPT Moments of Embodied AI》的主題演講。

在演講中,王鶴指出,具身智能正邁向?qū)俚摹癆lphaGo時刻”與“ChatGPT時刻”

他表示,銀河通用已通過兩大突破觸及“AlphaGo時刻”:一是實現(xiàn)完全自主的人形機器人網(wǎng)球?qū)梗宫F(xiàn)了極致的全身協(xié)調(diào)與Sim2Real能力;二是讓靈巧手擺脫遙操作依賴,基于“靈巧世界模型”像人一樣使用螺絲刀等工具完成精密裝配與復雜操作。

面向更通用的“ChatGPT時刻”,王鶴提出構建結合VLA與世界模型的“世界動作模型(WAM)”。其最新的LDA模型不僅能在隱空間中推演并執(zhí)行長周期任務,還具備強大的多任務與跨機器人構型泛化能力,目前已在全家便利店、寧德時代及物流倉儲等真實場景實現(xiàn)全自主落地。

最后他總結,將WAM“大腦”與端到端控制器“小腦”結合,并在海量多維數(shù)據(jù)的驅(qū)動下,具身智能必將引爆第四次工業(yè)革命。

以下是王鶴在 ICRA 2026 大會發(fā)表的演講精編稿,雷峰網(wǎng)(公眾號:雷峰網(wǎng))·AI 科技評論基于原英文演講內(nèi)容進行了不改原意的翻譯編輯:

《Towards the AlphaGo and ChatGPT Moments of Embodied AI》


主講人:王鶴(He Wang),銀河通用

大家好,我是王鶴,銀河通用的創(chuàng)始人和CTO。今天我要演講的主題是:邁向具身智能的 AlphaGo 時刻與 ChatGPT 時刻。

銀河通用創(chuàng)始人王鶴:具身智能正邁向?qū)俚摹窤lphaGo時刻」與「ChatGPT時刻」 | ICRA 2026

銀河通用(Galbot)是一家致力于開發(fā)通用機器人和具身基礎模型的獨角獸初創(chuàng)公司。我們的使命是:讓通用機器人賦能千行百業(yè),并走進千家萬戶。 帶著這個宏大的使命,我們最好先回顧一下“數(shù)字AI”的發(fā)展歷程,因為數(shù)字AI的步伐比具身智能領先了幾步。

銀河通用創(chuàng)始人王鶴:具身智能正邁向?qū)俚摹窤lphaGo時刻」與「ChatGPT時刻」 | ICRA 2026

首先,我們經(jīng)歷了 AlphaGo 時刻:AI首次在一個單一但足夠復雜的棋類游戲(圍棋)中擊敗了人類。然后,人們從單一任務中找到了規(guī)模擴張(Scale up)的方法。這帶來了從 GPT-2 到 ChatGPT 時刻的演進,單一模型開始能夠處理幾乎所有的語言任務。而現(xiàn)在,人們?nèi)栽谙蛑?AGI(通用人工智能)時刻 邁進。

如果我們審視具身智能,我們實際上正在完全遵循這條路徑,只不過物理世界的情況截然不同。為了實現(xiàn)具身智能的“AlphaGo 時刻”,我們必須選擇一個足夠復雜的任務。這個任務需要極高的全身協(xié)調(diào)能力(Whole-body coordination)以及極其復雜的策略,因此,我們選擇了網(wǎng)球(Tennis)。

銀河通用創(chuàng)始人王鶴:具身智能正邁向?qū)俚摹窤lphaGo時刻」與「ChatGPT時刻」 | ICRA 2026

因此,我們首次讓完全自主的人形機器人與人類進行真實的對抗,這中間沒有任何遙操作,一切都在完全自主模式下進行。 這項突破不僅體現(xiàn)在身體協(xié)調(diào)上,更體現(xiàn)在高階策略上。大家可以看到,我們的機器人學會了如何擊敗人類。它在這里,準備就緒并成功回球。實際上,我們利用了內(nèi)部的仿真平臺來支持強化學習的訓練,更重要的是,實現(xiàn)了 Sim2Real的遷移。 實際上,這是與 AlphaGo 最大的不同之處:AlphaGo 是在純數(shù)字世界里下棋,而在物理世界中打網(wǎng)球的 Sim2Real 難度極高。但我們非常自豪,我們的策略模型可以直接部署在現(xiàn)實世界中,無需任何微調(diào)。 人們可能會反駁說:“哦,你們還需要展示一些關于手部精細操作的能力,才能真正宣稱達到了 AlphaGo 時刻?!?。

銀河通用創(chuàng)始人王鶴:具身智能正邁向?qū)俚摹窤lphaGo時刻」與「ChatGPT時刻」 | ICRA 2026

因此,我們首次讓機器人的靈巧手完全像人類一樣去使用工具。大家現(xiàn)在看到的是使用螺絲刀進行精密裝配。我們后續(xù)還會看到更多手中操作(In-hand manipulation)的例子,比如使用刀具、錘子,甚至把桌腿安裝到桌子上。我們是如何做到的呢?

銀河通用創(chuàng)始人王鶴:具身智能正邁向?qū)俚摹窤lphaGo時刻」與「ChatGPT時刻」 | ICRA 2026

我們同樣是在仿真器中學習這項技能,但考慮到這個任務具有極高的接觸豐富度(Contact-rich),我們需要將模型部署到現(xiàn)實世界中去獲取一些展開軌跡,即使初始階段它的表現(xiàn)可能比較一般。 這些現(xiàn)實軌跡被用來訓練一個“靈巧世界模型”,基于神經(jīng)動力學的殘差預測,我們可以利用它進一步大幅改進策略。

銀河通用創(chuàng)始人王鶴:具身智能正邁向?qū)俚摹窤lphaGo時刻」與「ChatGPT時刻」 | ICRA 2026

接下來是一個與 Figure 機器人的并排對比(Side-by-side comparison)??纯?Figure 是如何用手指擰開瓶蓋的——你會發(fā)現(xiàn)它其實是抓緊瓶蓋,然后整個手腕旋轉(zhuǎn),再松開。這可能是因為他們依賴遙操作(Teleoperation)來收集數(shù)據(jù)。然而,如果你使用強化學習(RL),手指之間就能產(chǎn)生自然的協(xié)調(diào),做出更加流暢的動作。

銀河通用創(chuàng)始人王鶴:具身智能正邁向?qū)俚摹窤lphaGo時刻」與「ChatGPT時刻」 | ICRA 2026

此外,像 Nvidia 在 2023 年展示了在仿真器中“轉(zhuǎn)筆(Pen spinning)”,但他們僅僅停留在了仿真階段。而我們首次在現(xiàn)實世界中實現(xiàn)了這種連續(xù)的靈巧盤玩。所以,這就是為什么我認為我們即將迎來具身智能的 AlphaGo 時刻,哪怕很多人目前還覺得這些任務難以企及。

那么,下一步是什么?我們?nèi)绾尾拍茏呦蚓呱碇悄艿?ChatGPT 時刻?

銀河通用創(chuàng)始人王鶴:具身智能正邁向?qū)俚摹窤lphaGo時刻」與「ChatGPT時刻」 | ICRA 2026

我們需要找到一種方法來定義一個通用模型。這將是一個結合了 VLA(視覺-語言-動作)和世界模型的“世界動作模型”(World Action Model, WAM)。 要知道,雖然“世界動作模型”已經(jīng)被公認為是具身基礎模型 Scale up 最有希望的路徑,但銀河通用(Galbot)早就在此前的頂級論文(如ICCV)中定義了它。如果你在 arXiv 上搜索 World Action Model,最早的論文之一就是來自銀河通用的。

銀河通用創(chuàng)始人王鶴:具身智能正邁向?qū)俚摹窤lphaGo時刻」與「ChatGPT時刻」 | ICRA 2026

我們最新的世界動作模型被稱為 LDA(Latent Dynamics Action Model),它實現(xiàn)了從“在像素空間中想象(Imagining in pixels)”到“在隱空間中想象(Imagining in the latent space,即 DINO 空間)”的跨越。

銀河通用創(chuàng)始人王鶴:具身智能正邁向?qū)俚摹窤lphaGo時刻」與「ChatGPT時刻」 | ICRA 2026

這個模型允許我們執(zhí)行超長周期(Long-horizon)的任務。例如,我們可以看到機器人能夠完全自主地煎牛排:它加速使用平底鍋,抓起牛排,翻面,抽出下面那塊,然后移動到盤子里,松開夾子(Tongs),撒上調(diào)料——全都是完全自主完成的。

銀河通用創(chuàng)始人王鶴:具身智能正邁向?qū)俚摹窤lphaGo時刻」與「ChatGPT時刻」 | ICRA 2026

同時,這個單一模型還展現(xiàn)出了強大的多任務能力,從撿起碎玻璃、疊衣服、貨架揀貨補貨,到把肉穿到烤串上(Thread meat onto skewers)。并且,它能夠泛化到不同的機器人構型上:包括帶輪子的長臂機器人、帶腿的短臂機器人,以及宇樹(Unitree)的機器人都能適配。左邊的機器人同樣來自銀河通用(Galbot),右邊也有宇樹的 G1 系列。

銀河通用創(chuàng)始人王鶴:具身智能正邁向?qū)俚摹窤lphaGo時刻」與「ChatGPT時刻」 | ICRA 2026

我們已經(jīng)在許多實際場景中部署了我們的機器人。比如,我們接待過一位??怂剐侣劊‵ox News)的主持人,他參觀了第一家由人形機器人運營的全家便利店(Family Mart)。我們的機器人也在不同的物流倉庫中工作,在數(shù)十萬平米的廠區(qū)里經(jīng)過了多次迭代。

銀河通用創(chuàng)始人王鶴:具身智能正邁向?qū)俚摹窤lphaGo時刻」與「ChatGPT時刻」 | ICRA 2026

此外,我們的重載(Heavy-duty)機器人已經(jīng)部署在了寧德時代(CATL)。這款機器人可以搬運 50 公斤重的物體,處于完全自主模式下。而且它可以自己更換電池,因此實際有效工作時間是每天24小時。

那么,我們什么時候才能迎來 ChatGPT 時刻呢?

銀河通用創(chuàng)始人王鶴:具身智能正邁向?qū)俚摹窤lphaGo時刻」與「ChatGPT時刻」 | ICRA 2026

我認為,我們首先需要將“大腦”(Cerebrum)和“小腦”(Cerebellum)結合起來。“大腦”將是 WAM(世界動作模型),而“小腦”將是一個全身、全手的控制器(Whole-body, whole-hand controller)。它們絕大多數(shù)都將是通過神經(jīng)網(wǎng)絡進行端到端(End-to-end)訓練的。

銀河通用創(chuàng)始人王鶴:具身智能正邁向?qū)俚摹窤lphaGo時刻」與「ChatGPT時刻」 | ICRA 2026

然后,我們要去吸收海量的數(shù)據(jù):包括仿真數(shù)據(jù)、現(xiàn)實世界的遙操作數(shù)據(jù),以及第一人稱視角數(shù)據(jù)(Egocentric data)。在這里,第一人稱視角數(shù)據(jù)是一個極具擴展性的數(shù)據(jù)源,實際上我們在五年前就開始了第一人稱數(shù)據(jù)收集的研究(即我們的 CVPR 2022 論文)。

銀河通用創(chuàng)始人王鶴:具身智能正邁向?qū)俚摹窤lphaGo時刻」與「ChatGPT時刻」 | ICRA 2026

這幫助我們構建了一個全面的數(shù)據(jù)基礎設施:從互聯(lián)網(wǎng)數(shù)據(jù)、人類第一人稱數(shù)據(jù)、跨構型的仿真數(shù)據(jù)、現(xiàn)實世界遙操作數(shù)據(jù),到基于策略(On-policy)的強化學習獎勵數(shù)據(jù)。這個數(shù)據(jù)金字塔將成為推動我們邁向 ChatGPT 時刻的核心燃料。

銀河通用創(chuàng)始人王鶴:具身智能正邁向?qū)俚摹窤lphaGo時刻」與「ChatGPT時刻」 | ICRA 2026

我相信,整個社區(qū)的同仁們都會為了 AGI 時刻全力以赴。一旦我們到達那里,我們將見證第四次工業(yè)革命——它將伴隨著智能手機般的普及規(guī)模、汽車般的硬件價格,以及大模型帶來的巨大溢價。

銀河通用創(chuàng)始人王鶴:具身智能正邁向?qū)俚摹窤lphaGo時刻」與「ChatGPT時刻」 | ICRA 2026

歡迎大家來我們的 137號展位(Booth 137) 參觀,親自感受一下機器人打網(wǎng)球和貨架揀貨的震撼體驗。謝謝大家!

銀河通用創(chuàng)始人王鶴:具身智能正邁向?qū)俚摹窤lphaGo時刻」與「ChatGPT時刻」 | ICRA 2026

去哪看ICRA【演講/論文】詳解?

為了讓國內(nèi)的研發(fā)者、創(chuàng)業(yè)者與投資人能夠毫無時差地掌握本屆 ICRA 2026 的完整干貨,雷峰網(wǎng)已全面上線【ICRA 2026 深度專區(qū)】。

專區(qū)不僅全面收錄了重磅論文的工程化解讀、專家前沿演講,更將持續(xù)更新前方記者的第一手會議動態(tài)。

掃描下方二維碼,或點擊閱讀原文關注專區(qū)。

銀河通用創(chuàng)始人王鶴:具身智能正邁向?qū)俚摹窤lphaGo時刻」與「ChatGPT時刻」 | ICRA 2026

與全球 8000 名頂尖大腦同步呼吸,搶先透視具身智能的下一個五年!

分享:
相關文章
最新文章
請?zhí)顚懮暾埲速Y料
姓名
電話
郵箱
微信號
作品鏈接
個人簡介
為了您的賬戶安全,請驗證郵箱
您的郵箱還未驗證,完成可獲20積分喲!
請驗證您的郵箱
立即驗證
完善賬號信息
您的賬號已經(jīng)綁定,現(xiàn)在您可以設置密碼以方便用郵箱登錄
立即設置 以后再說
高雄县| 呼图壁县| 宝兴县| 北辰区| 清徐县| 杭锦后旗| 福贡县| 陕西省| 正镶白旗| 金华市| 兰西县| 景德镇市| 襄城县| 云和县| 育儿| 古交市| 平舆县| 连南| 巴塘县| 庆安县| 岗巴县| 龙海市| 博乐市| 耒阳市| 成都市| 西乡县| 巴马| 棋牌| 丰镇市| 曲阜市| 宝鸡市| 绿春县| 洛扎县| 平武县| 米泉市| 阳江市| 姜堰市| 崇文区| 枣阳市| 板桥市| 龙江县|