
如果「觸手可及的開放式人工智慧」而非龐大的雲端人工智慧成為焦點,會怎麼樣?這將如何改變我們的工作方式和產品設計方式?
「米斯特拉爾3」很可能成為檢驗「分散式智慧時代」是否真正到來的試金石。
歐洲人工智慧新創公司 Mistral AI 於 12 月 2 日宣布推出「Mistral 3」系列 10 個開源模型。
旗艦模型 Mistral Large 3 採用混合專家架構,在總共 6750 億個參數中,有 410 億個活躍參數,可處理高達 256,000 個代幣的上下文視窗。
「Ministral 3」小型模型系列共有三種規格:140億、80億和30億參數。最小的模型可在4GB顯存下運作。所有模型均以Apache 2.0許可證商業發布。
該公司首席科學官 Guillaume Lample 表示,在 90% 以上的情況下,較小的型號經過微調後也能表現良好。
從:
Mistral 發布 Mistral 3,這是一系列開放式模型,旨在運行於筆記型電腦、無人機和邊緣設備——VentureBeat
【社論】
Mistral 3 版本最顯著的特點是它提出了人工智慧產業的典範轉移。
當 OpenAI 和 Google 專注於大型雲端模型的效能競爭時,Mistral 選擇了相反的策略:透過提供僅需 4GB 記憶體即可運行的緊湊型模型,它設想未來人工智慧可以擺脫雲端的束縛,部署到智慧型手機、無人機甚至車載系統中。
這項策略的背景是企業面臨的實際挑戰。許多公司使用像 GPT-4 這樣的大型模型來建立原型,但在生產環境中使用這些模型時,卻面臨高昂的 API 成本和延遲問題。 Mistral的解決方案是使用針對特定任務進行微調的小型模型。據該公司稱,在超過 90% 的情況下,擁有 140 億到 240 億個參數的模型就能達到足夠的性能。
從技術面來看,Mistral Large 3 的混合專家模型結構很有意思,因為它只啟動了 6,750 億個參數中的 410 億個。這種設計顯著降低了運行成本,同時保留了大型模型的知識。此外,25.6 萬個詞元的大型上下文視窗足以一次性處理超過一本書的文本量。
選擇完全開源的 Apache 2.0 授權也是一項策略性舉措。它允許公司使用自身資料修改模型,從而消除知識產權外洩的風險。在金融、醫療保健和國防等監管嚴格的行業,這種透明度將成為至關重要的差異化優勢。
然而,挑戰依然存在。正如蘭普爾在文章中承認的那樣,Mistral 的模式在絕對業績上並不遜於 Frontier 的模式。該公司在 2025 年 9 月的估值約為 140 億美元,這代表著自成立以來短短兩年半時間的快速成長,但開源策略與企業獲利模式之間的平衡將是未來永續發展的關鍵。
然而,從人工智慧民主化的角度來看,這一趨勢至關重要。人工智慧即使在沒有網路連線的環境中也能運行,並且可以在發展中國家的基礎設施中發揮作用,或者在災難導致通訊中斷的情況下也能正常運作。此外,在需要即時性能的機器人和自動駕駛領域,擺脫對雲端運算的依賴至關重要。
Mistral 認為,人工智慧市場將從少數超大型模型演變為眾多專業化模型。如果這項預測成真,該公司將確立其作為新一代基礎設施提供者的地位。
[術語]
專家混合小組(教育部)
這種架構結合了多個專用神經網路(專家)。透過根據輸入選擇性地使用最合適的專家,可以在保持參數總數不變的情況下降低計算成本。 Mistral Large 3 在運行時僅使用了總共 6750 億個參數中的 410 億個。
邊緣運算<br>這項技術在設備端(邊緣)而非雲端處理資料。它對物聯網設備和自動駕駛汽車的重要性日益凸顯,因為它能降低通訊延遲、保護隱私並支援離線運作。
Apache 2.0 授權<br>這是一種開源軟體授權格式,允許免費進行商業使用、修改和重新分發。它適用於商業用途,因為公司可以對其進行自訂並進行商業部署。
微調<br>一種技術,用於對預訓練的人工智慧模型進行進一步訓練,使其適用於特定任務或領域。它允許使用少量資料建立高精度模型,並用於針對特定任務最佳化通用模型。
上下文視窗
這是人工智慧模型一次能夠處理的文字量的上限。它以詞元(token)的數量來表示,256,000 個字元大約相當於 190,000 個單詞,或大約 380,000 個日語字符。這對於分析長篇文件和複雜對話來說是一個重要的指標。
4 位元量化<br>這是一種壓縮技術,它將模型的權重參數表示為 4 位元(16 階)整數。雖然略微犧牲了精度,但它顯著降低了記憶體佔用,並使其能夠在通用設備上運行。
數位主權<br>這是指各國和組織保留對其自身數位基礎設施和資料的控制權。尤其在歐洲,這被強調為一項旨在減少對美國和中國科技公司依賴並建立獨立人工智慧技術基礎的政策。
[參考連結]
Mistral AI 官方網站(外部連結)
這是歐洲領先的人工智慧新創公司的官方網站。它列出了每個型號的技術規格、API 和產品線,包括 Mistral 3 系列。
Mistral 3 公告頁面(外部連結)
Mistral 3 系列官方發佈頁面。 Mistral Large 3 和 Ministral 3 系列的詳細規格和基準測試結果已發布。
擁抱臉-專家評論(外在)
這是一篇來自機器學習社群的技術文章,介紹了混合專家架構,詳細闡述了混合專家架構的工作原理、優勢以及如何實現它。
OpenAI 官方網站(外部連結)
一家開發 GPT 系列的美國人工智慧研究機構。它是 Mistral 的競爭對手,也是閉源模型的典型代表。
人道組織官方網站(外部連結)
一家開發 Claude(Opus)系列人工智慧安全研究的公司。它是 Mistral 的競爭對手,與 Mistral 同時發布了 Opus 4.5。
Le Chat – Mistral AI 聊天助理(外部)
Mistral 是一款面向消費者的 AI 聊天助手,具有深度研究模式、語音功能和 20 多個企業整合。
DeepSeek 官方網站(外部連結)
一家來自中國的快速發展的人工智慧新創公司,開發開源人工智慧模型,被 Mistral 視為競爭對手。
[參考文章]
Mistral憑藉著新的開放權重前沿和小模型,正逐步逼近大型人工智慧競爭對手(外部)
本文闡述了 Mistral AI 如何透過將大規模開源模型與小型模型結合來滿足企業需求,而非採用「龐大的封閉模型」。文章特別以可在單 GPU 或筆記型電腦上運行的 Ministral 3 為例,解釋了 Mistral “針對多種任務對小型模型進行充分微調”的策略,並概述了成本、速度和可靠性方面面臨的挑戰。
法國人工智慧實驗室 Mistral 發布新的人工智慧模型,試圖與 OpenAI 和Google(外部連結)保持同步。
CNBC 的文章從商業角度概述了法國 Mistral AI 公司如何發布 Mistral 3 系列人工智慧晶片,並試圖與 OpenAI 和Google展開正面競爭。文章強調了開源和小規模模型策略在成本、數據主權和歐洲創新方面的優勢,並探討了該公司如何在財務資源和規模劣勢的情況下實現差異化競爭。
[編者註]
如果像 Mistral 3 這樣的「小巧而強大的 AI」變得普遍,我們對 AI 作為工作工具的看法很可能會改變。如果只需在筆記型電腦或其他設備上運行高效能模型,你會希望將其整合到哪些產品和工作流程中?
一旦你確定了周圍的用例,例如“一個小型模型就足以完成這項任務”或“我們仍然需要一個大型雲端模型”,你公司和你自己的 AI 策略的輪廓就會變得更加清晰。