小米的「MiMo-Embodied」現已開源,這是全球首個整合自動駕駛和機器人技術的AI平台模型。 小米的「MiMo-Embodied」現已開源,這是全球首個整合自動駕駛和機器人技術的AI平台模型。

小米的「MiMo-Embodied」現已開源,這是全球首個整合自動駕駛和機器人技術的AI平台模型。


2025年11月22日,小米宣布正式發布具身模型“MiMo-Embodied”,並將其完全開源。

MiMo-Embodied是業界首個融合自動駕駛和具身人工智慧的具身模型,在單一建模框架內實現了這兩個領域的功能。該模型同時支援具身人工智慧的三大核心任務——可供性推理、任務規劃和空間理解——以及自動駕駛的三大主要任務——環境感知、狀態預測和駕駛規劃。

在29項基準測試中,該模型在具身人工智慧的17項基準測試和自動駕駛的12項基準測試中均取得了最先進的結果。原始碼可在Hugging Face和arXiv上取得。

從: 文献リンク小米發布並完全開源 MiMo-Embodied,這是首款融合自動駕駛和具身智慧的車型。

【社論】

小米的 MiMo-Embodied 代表了人工智慧研究領域的重大範式轉變:自動駕駛和機器人技術傳統上是作為獨立的學科發展起來的,但該模型是第一個將它們整合到單一的開源框架中的模型。

這項技術創新在於「雙向知識遷移」的概念。透過室內操作機器人學習到的識別物體和理解空間的能力被應用於室外駕駛決策,反之,駕駛情境中的動態預測能力可以改善室內機器人的任務規劃,從而展現出協同效應。

據報道,小米計劃從2026年第一季開始,將MiMo-Embodied技術整合到其掃地機器人、AGV(自動導引車)和SU7高級駕駛輔助系統中。這不僅是公開研究成果,更是一項著眼於實際應用的策略性舉措。

值得注意的是,DeepSeek前首席研究員羅福麗也參與其中。她在DeepSeek-V2的開發中發揮了核心作用,目前領導小米的MiMo團隊,預計小米將在12月的合作夥伴大會上公佈更多細節。

這項開源計畫有望加速建構具身人工智慧生態系統。透過使家庭、出行和製造等不同領域的開發者能夠使用統一的智慧平台,預計該計劃將促進跨領域的技術創新。

然而,從安全角度來看,需要進行仔細的驗證。融合了自動駕駛和機器人這兩個安全關鍵領域的模型,必須滿足每個領域特定的風險評估標準。小米透過多階段學習流程(具身認知和駕駛技能學習、思考鏈推理強化以及強化學習優化)提高了可靠性,但在真實環境中進行長期驗證仍是未來的挑戰。

[術語]

具身人工智慧
這指的是擁有實體形態、能夠在與現實世界互動中學習和行動的人工智慧系統。這適用於諸如機器人和自動駕駛汽車之類的智慧型系統,它們利用感測器識別環境,並利用執行器做出物理反應。

可供性推理<br>理解環境中物體的用途以及如何操作它們的能力。例如,識別物體的各種可能性,例如能夠坐在椅子上或轉動門把手,並利用這些資訊來規劃行動。

思維鏈(CoT)
該方法使人工智慧能夠在給出最終答案之前,明確地產生逐步推理過程。透過將複雜問題分解成更小的步驟,可以提高推理的準確性和可靠性。

強化學習(RL)
一種人工智慧透過反覆試驗來學習最優行為的方法。它是機器學習的一個分支,利用獎勵訊號來獲得能夠長期產生理想結果的行為模式。

SOTA(最先進技術)
指目前在特定領域或任務中表現最佳的技術或方法。也指在基準測試中所取得的最高性能。

AGV(自動導引車)
自動導引車(Automated Guided Vehicle)的縮寫。這是一種無人駕駛車輛系統,可在工廠和倉庫內自主運輸貨物。它利用感測器和人工智慧技術來確定路線,從而實現高效的物流。

深潛
這是由中國公司DeepSeek開發的一個人工智慧研究計畫。該公司以開發高效的大規模語言模型而聞名,DeepSeek-V3已引起國際關注。

[參考連結]

小米 MiMo-Embodied 官方 GitHub 程式碼庫(外部)
原始碼、模型權重和技術文件可在官方頁面上找到,研究人員和開發人員可以在那裡查看實現情況。

MiMo-Embodied 技術論文(arXiv) (外部連結)
小米發布了一份詳細的技術報告,詳細介紹了模型架構、訓練方法和基準測試結果。

擁抱的臉 – MiMo-Embodied (外在)
論文頁面已發布給人工智慧/機器學習社區,社區回饋和討論也可在該頁面上進行。

小米官方網站(外部連結)
中國科技公司,主要研發智慧型手機、家用電器和電動汽車。將人工智慧技術整合到SU7智慧型手機和掃地機器人中。

[參考文章]

小米開源涵蓋自動駕駛和機器人領域的AI模型(外部連結)
《南華早報》發表詳細文章,並報告了2026年第一季實施計畫以及12月舉行的合作夥伴會議。

MiMo-Embodied:X-Embodied 基礎模型技術報告(外部)
官方技術文件詳細介紹了 29 項基準評估、多階段學習流程和雙向知識遷移。

小米開源跨領域具身大型模式 MiMo-Embodied (外部)
AI NEWS 的報導詳細介紹了羅福立加入 MiMo 團隊的消息,並計劃在 12 月的會議上發表演講。

[編者註]

直到不久前,人們還難以想像自動駕駛汽車和掃地機器人有一天會由同一套「智慧」驅動。在家中學習到的空間識別能力將使汽車在道路上做出更明智的決策。我們如何才能利用這些技術的綜效?您認為這種整合智能在日常生活中的哪些場景會派上用場?讓我們一起暢想智慧家居和智慧移動的未來。