
德國人工智慧新創公司Black Forest Labs於2025年11月26日(日本時間)發布了圖像生成和編輯系統「FLUX.2」。該公司由Stable Diffusion的開發者Robin Rombach等人創立,此前已獲得由Andreessen Horowitz領投的3100萬美元種子輪融資,備受關注。
FLUX.2 提供多種型號,以滿足不同的應用需求。頂級型號 Flux.2 [Pro] 採用按需付費模式(Black Forest Labs 的官方 API 對首個百萬像素收費 0.03 美元,之後每百萬像素收費 0.015 美元),旨在降低生成高分辨率圖像的成本,使其優於同類封閉式模型。
Flux.2 [Dev] 面向開發者發布,是一個開放的權重模型,擁有約 320 億個參數,可以進行高度靈活的實驗,用於研究和驗證目的。
其功能亮點在於“多參考影像處理”。它可以同時載入多達10張參考影像,並在保持影像特徵的同時,高精度地產生和編輯這些影像。與Google最新款Gemini 3 Pro Image(俗稱Nano Banana Pro)相比,它也具有極高的性價比。
同時宣布,輕量級模型 Flux.2 [Klein] 和核心影像壓縮技術 Flux.2 VAE 將根據 Apache 2.0 授權開源發布。
從:
Black Forest Labs推出Flux.2 AI圖像模型,挑戰Nano Banana Pro和Midjourney。
【社論】
FLUX.2 版本最顯著的特點是影像生成 AI 從實驗性工具發展成為可靠的商業應用基礎。先前的影像生成 AI 存在許多問題,例如結果會因提示訊息的不同而出現顯著差異、文字損壞以及無法在多張影像中保持字元一致等。 FLUX.2 旨在從技術層面解決這些實際瓶頸。
「多參考功能」尤其重要。它能夠從多達10張參考圖像中產生圖像,同時保持圖像的一致性,這大大提高了為電商網站創建產品圖像變體以及製作符合品牌指南的素材的效率。以前需要人工完成的工作現在可以由人工智慧自動完成,確保影像的一致性。
從技術角度來看,它具有 320 億個參數的龐大模型規模,這大大提高了遵循複雜指令的能力以及光照、材料等的物理一致性。
成本競爭力也不容忽視。 Google的Gemini 3 Pro Image(Nano Banana Pro)產生一張4K(4096 x 4096)影像的成本約為0.24美元。
另一方面,FLUX.2 [Pro] 透過 Black Forest Labs 的官方 API 計費,第一個百萬像素收費 0.03 美元,之後每個百萬像素收費 0.015 美元,這樣即使在高解析度下,也能根據您的實際使用模式輕鬆降低總成本。
在公司需要產生大量產品圖片和廣告創意的情況下,這些按使用付費模式的差異可能會對年度成本產生很大影響。
VAE(變分自編碼器)的意義也十分重大,它將以 Apache 2.0 授權發布。 VAE 是一項用於影像壓縮和復原的核心技術,開源後,企業可以更輕鬆地將其整合到自身環境中。此外,VAE 還可免費用於商業用途,避免對特定供應商的依賴,作為長期技術投資,可帶來安心保障。
另一方面,高精度生成逼真圖像和文字的能力也意味著虛假資訊和濫用的風險增加。黑森林實驗室制定了嚴格的使用條款,但隨著這項技術的普及,驗證內容真實性的機制以及諸如水印技術之類的應對措施就顯得尤為重要。
此次發布也體現了開源與商業的兼容性。它並非完全開放,而是採用了“開放核心策略”,將免費使用部分與商業服務明確區分開來。這有望成為可持續人工智慧發展的商業模式,並成為行業標準。
[術語]
公開組體重模型
這是一種公開人工智慧模型訓練參數(權重)的形式。與完全開源不同,訓練程式碼和資料集可能不會公開。雖然研究人員和開發人員可以自由地進行實驗,但商業用途通常需要單獨的許可證。
VAE(變分自編碼器)
這是一個機器學習模型,它將影像壓縮到低維度潛在空間,然後再將其恢復到高解析度。影像生成AI透過操作這種壓縮表示來實現高效的生成和編輯。它是FLUX.2中實現400萬像素高品質影像復原的核心技術。
ELO 評分<br>最初是用於評估國際象棋水平的指標,在人工智慧領域,它被用於以競爭形式比較和評估多個模型。分數越高,與其他模型相比,結果越好。
Apache 2.0 許可證<br>這是一個開源許可證,允許免費的商業使用、修改和再分發。它被廣泛採用,因為它是一種寬鬆的許可證,允許公司放心地將其整合到自己的產品中。
延遲<br>系統接收請求到做出回應之間的時間差。在影像生成人工智慧中,它指的是從提示輸入到影像輸出的等待時間。可預測的低延遲對於商業應用至關重要。
多參考影像處理技術<br>這項技術使用多張參考影像作為條件來產生新影像,同時保留其特徵。 FLUX.2 可同時處理多達 10 張參考影像,讓您能夠創建不同場景和角度的影像,同時保持角色一致性和產品細節。
[參考連結]
黑森林實驗室官方網站(外部連結)
由穩定擴散(Stable Diffusion)開發者創立的德國人工智慧新創公司。該公司開發並提供圖像生成模型,包括 FLUX.2。
FLUX.2 官方部落格(外部連結)
本文檔包含 FLUX.2 的技術細節、模型變體和基準測試結果。它還包括每個模型的效能比較和架構說明。
FLUX API 定價(外部)
我們提供了一個 FLUX.2 定價計算器,您可以模擬基於百萬像素的計費系統以及不同解析度的具體成本。
安德森·霍洛維茨基金(a16z) (外部)
領投 Black Forest Labs 3,100 萬美元種子輪融資的創投公司是一家美國大型創投公司,該公司積極投資於人工智慧和 Web3 領域。
NVIDIA開發者部落格 – FLUX.2 (外部連結)
本文闡述了與 NVIDIA 合作實現的 fp8 最佳化方案,並提供了有關使用 ComfyUI 進行本地執行的技術資訊。
[參考文章]
影像生成人工智慧「FLUX.2」終於問世——GIGAZINE (外部連結)
本報告全面介紹了 FLUX.2 的發佈內容和技術進步,並提供了基準測試結果、競品對比以及具體數據,展現了其價格優勢。
[編者註]
人工智慧影像生成的浪潮正席捲我們的日常生活和工作場所。你是否曾經有過一些你認為手作無法完成的創意任務?或者,你是否曾因表達方式的拓展而感到興奮不已?不妨思考一下,人工智慧的演進將為你的工作帶來哪些新想法?現在,我們比以往任何時候都更渴望共同探索未來的無限可能。