阿里千問發布其首個完整的具身智能模型矩陣


    中國產業經濟信息網   時間:2026-06-25





      日前,阿里千問發布了具身智能大模型Qwen-Robot系列,這是千問大模型家族首個完整的具身智能模型矩陣。


      具身智能被認為是AI從“數字世界對話”走向“物理世界行動”的關鍵一步。Qwen-Robot系列的發布,是阿里在具身智能領域的一次重要布局。它試圖通過統一的模型架構,解決機器人在不同形態、不同場景下的適配難題。


      據了解,Qwen-Robot系列的核心目標是彌合語言指令與物理動作之間的鴻溝,讓機器人能夠理解自然語言、感知三維環境并掌握物理規律。該系列包含三個核心模型,可以理解為給機器人裝上了“手”“腳”和“大腦”。


      其中,Qwen-RobotManip是一個VLA(視覺-語言-動作)操作模型,通過規范狀態-動作空間和相機坐標系下的末端執行器增量位姿,把視覺語言能力接入操作控制,基于完全由開源數據構建的>38100小時語料庫實現了大規模多機型訓練。Qwen-RobotNav是一個VLN(視覺-語言-導航)移動模型,通過可控觀測編碼和工具接口,把視覺語言能力接入移動控制,統一了指令跟隨、點/目標導航、目標追蹤和自動駕駛四類任務。Qwen-RobotWorld是一個世界模型,通過自然語言動作接口,把視覺語言能力接入世界動態預測,讓同一個世界模型能夠跨操作、駕駛和導航場景預測符合物理規律的未來。


      此外,千問團隊還推出了一個內部項目——Qwen-RobotClaw機器人智能體框架,使Qwen VLM 智能體能夠將Qwen-Robot Suite模型作為物理世界工具調用,同時妥善管理長程任務所需的上下文與記憶,推動物理智能走向更通用、更復雜的真實應用場景。(岳 文)


      轉自:中國電子報

      【版權及免責聲明】凡本網所屬版權作品,轉載時須獲得授權并注明來源“中國產業經濟信息網”,違者本網將保留追究其相關法律責任的權力。凡轉載文章及企業宣傳資訊,僅代表作者個人觀點,不代表本網觀點和立場。版權事宜請聯系:010-65363056。

    延伸閱讀

    ?

    版權所有:中國產業經濟信息網京ICP備11041399號-2京公網安備11010502035964

    www.色五月.com