8月14日消息,據媒體報道,智元機器人正式推出業內首個開源的機器人世界模型平臺——Genie Envisioner (GE)。
GE 平臺顛覆了傳統機器人學習流程,創新性地構建了一個以統一視頻生成世界模型為核心的閉環系統。該系統整合了未來幀預測、策略學習與仿真評估,使機器人能夠在單一模型中完成從感知環境、思考決策到執行動作的端到端處理。
平臺的核心優勢在于其無縫集成的閉環設計:GE-Base 模型基于超百萬條數據訓練,擅長解析環境布局與動作意圖;GE-Act 動作解碼器負責將理解轉化為具體動作指令;而GE-Sim 則作為基于動作條件的神經仿真器,利用分層機制實現精準視覺預測。三者協同工作,驅動整個平臺高效運行。
為構建這一強大平臺,智元機器人利用了約3000小時的真實機器人操控視頻數據。這些寶貴數據幫助 GE 建立了從語言指令到視覺空間的直接映射,完整保留了交互的時空信息,為模型的準確性和實用性奠定了堅實基礎。
在實際測試中,搭載 GE-Act 組件的機器人已成功完成制作三明治、倒茶、擦拭桌面等多項任務。這有力驗證了 GE 平臺的性能,并展示了其在提升機器人智能交互與任務執行能力方面的廣闊應用前景。
本站內容除特別聲明的原創文章之外,轉載內容只為傳遞更多信息,并不代表本網站贊同其觀點。轉載的所有的文章、圖片、音/視頻文件等資料的版權歸版權所有權人所有。本站采用的非本站原創文章及圖片等內容無法一一聯系確認版權者。如涉及作品內容、版權和其它問題,請及時通過電子郵件或電話通知我們,以便迅速采取適當措施,避免給雙方造成不必要的經濟損失。聯系電話:010-82306118;郵箱:aet@chinaaet.com。