近日,北京人形機(jī)器人創(chuàng)新中心開源全新具身世界模型WoW(World-Omniscient World Model),攻克機(jī)器人理解物理世界的核心難題,獲Huggingface官方盛贊及斯坦福等學(xué)界引用,標(biāo)志我國(guó)在該領(lǐng)域躋身世界前列。

相較于僅能“看世界”的Sora系列,WoW實(shí)現(xiàn)從“觀察”到“理解”的跨越,構(gòu)建融合視覺、動(dòng)作、物理感知與推理的統(tǒng)一框架。其核心突破在于四大技術(shù)組件:DiT世界生成基座模型作為“物理引擎+想象系統(tǒng)”,從200萬(wàn)條高質(zhì)量交互軌跡中學(xué)習(xí)物理規(guī)律;FM-IDM逆動(dòng)力學(xué)模型實(shí)現(xiàn)“視頻到動(dòng)作”閉環(huán),能從視覺預(yù)測(cè)反推可執(zhí)行的機(jī)器人運(yùn)動(dòng)指令;SOPHIA范式通過“生成-批評(píng)-修正”迭代循環(huán),模擬人類智能的反思過程;全球首個(gè)具身世界模型基準(zhǔn)WoWBench,則建立起感知理解、預(yù)測(cè)推理等四大維度的量化評(píng)估標(biāo)準(zhǔn)。
實(shí)測(cè)顯示,WoW在物理一致性上優(yōu)勢(shì)顯著,復(fù)雜動(dòng)力學(xué)場(chǎng)景表現(xiàn)領(lǐng)先,驅(qū)動(dòng)機(jī)器人完成簡(jiǎn)單任務(wù)成功率達(dá)94.5%,中等難度任務(wù)成功率75.2%,生成動(dòng)作可直接部署于真實(shí)機(jī)械臂。此次開源涵蓋1.3B至14B參數(shù)的預(yù)訓(xùn)練模型、推理代碼等,大幅降低行業(yè)研究門檻。
作為“最能跑、最好用”的技術(shù)延伸,WoW模型可賦能機(jī)器人自主完成抓取、裝配等任務(wù),還能實(shí)現(xiàn)數(shù)據(jù)自生成與優(yōu)化。這一突破進(jìn)一步夯實(shí)北京人形機(jī)器人創(chuàng)新中心的技術(shù)領(lǐng)先地位,加速具身智能機(jī)器人落地應(yīng)用。
友情鏈接: 政府 高新園區(qū)合作媒體
Copyright 1999-2025 中國(guó)高新網(wǎng)chinahightech.com All Rights Reserved.京ICP備14033264號(hào)-5
電信與信息服務(wù)業(yè)務(wù)經(jīng)營(yíng)許可證060344號(hào)主辦單位:《中國(guó)高新技術(shù)產(chǎn)業(yè)導(dǎo)報(bào)》社有限責(zé)任公司