
2025年12月16日,OpenAI發布了新版ChatGPT Images,其中包含全新的旗艦級影像生成模型。新模型產生影像的速度提升高達四倍,並以GPT Image 1.5的形式在API中提供。全新的Images體驗已於今日為多數用戶推出,企業版和公司版將於稍後推出。
此模型可在保持光照、構圖和人物外觀一致性的同時,進行精準的編輯。它支援多種編輯類型,包括添加、移除、合併、混合和轉置,並改進了文字渲染。與 GPT Image 1 相比,API 中的影像輸入和輸出成本降低了 20%。
Wix、Canva 和 Envato 等公司已經在使用 GPT Image 1.5,而新模型今天將在全球所有 ChatGPT 和 API 用戶上推出。
從:
新的 ChatGPT 圖片來了
【社論】
OpenAI 在影像生成領域取得了重大進展。近期發布的 GPT Image 1.5 不僅提升了效能,而且有望從根本上改變影像生成 AI 的實用性。
最顯著的技術突破在於「編輯過程中保持一致性」。傳統的影像生成人工智慧存在一個問題:一旦影像生成,對其進行額外的編輯可能會改變臉部特徵、光線和構圖等重要元素。 GPT Image 1.5 克服了這個問題,即使經過多次編輯,也能保留原始影像的基本特徵。
這種技術演進意味著人工智慧已從一次性工具發展成為迭代式創意夥伴,使設計師和行銷人員能夠透過反覆試驗來追求理想的視覺效果。
別忘了它四倍的生成速度。能夠即時將想法視覺化是保持創作思維流暢的關鍵。而且,隨著 API 價格下降 20%,企業大規模採用 API 已成為現實。
Wix 和 Canva 等主流平台已經採用這項技術,這證明它已經達到了實用階段。尤其是在電子商務領域,這項技術有望透過從單張產品照片生成多種變體和場景,從而顯著降低生產成本。
然而,正如OpenAI自己承認的那樣,“結果仍不完整”,它並非一項完美的技術。在回應複雜指令和渲染多語言文字方面,仍有改進空間。
此外,隨著產生高品質影像變得越來越容易,虛假資訊傳播和深度偽造技術濫用的風險也隨之增加。因此,有必要持續關注OpenAI採取的安全措施。
[術語]
ChatGPT 圖片
這是 OpenAI 提供的一項 AI 圖像生成功能,可根據文字生成圖像或編輯現有圖像。它已整合到 ChatGPT 中,並可使用自然語言指令建立或修改影像。
GPT 影像 1.5
這是OpenAI開發的最新影像生成AI模型。它可透過API取得,與先前的模型GPT Image 1相比,在編輯精確度、產生速度和一致性方面均有所提升。
迅速的
在人工智慧圖像生成中,這些指令或說明是向人工智慧提供的,用於產生使用者想要的圖像。提示越具體、越詳細,就越有可能產生符合使用者意圖的影像。
API(應用程式介面)
一種用於在應用程式之間交換資料和功能的機制。開發者可以透過 API 將 OpenAI 的圖像生成功能整合到自己的服務和應用程式中。
文字渲染<br>在圖像中以視覺方式呈現字母或文字的過程。在人工智慧圖像生成中,它指的是將指定文字準確、清晰地放置在圖像中的能力。
[參考連結]
OpenAI 官方網站(外部連結)
這是開發 ChatGPT 和 GPT 系列人工智慧研究機構的官方網站。它提供最新的研究成果和產品資訊。
OpenAI API 文件(外部)
面向開發者的官方文檔,提供 OpenAI API 的技術規格、使用說明、定價結構等。
OpenAI Playground (外部)
一個基於網頁的介面,讓您無需編寫任何程式碼即可體驗 OpenAI 模型。
Wix 官方網站(外部連結)
一家提供網站創建平台的以色列公司。它使用 GPT Image 1.5。
Canva 官方網站(外部連結)
澳洲圖形設計平台。已整合 GPT Image 1.5 以增強設計功能。
[參考文章]
OpenAI 繼續推進其「紅色警報」攻勢,推出新的影像生成模型(外部連結)
TechCrunch 的公告文章報導,生成速度提高了 4 倍,API 價格降低了 20%。
OpenAI 的 GPT Image 1.5 在企業級視覺效果方面向Google發起挑戰(外部連結)
VentureBeat 的一篇技術文章,重點介紹了編輯過程中的一致性維護技術,並提供了與先前模型的詳細比較。
OpenAI 發布 GPT Image 1.5,產生速度提升 4 倍,並提供更精準的編輯控制(外部訊息)
本報告詳細介紹了 GPT Image 1.5 的主要功能及其在公司中的應用實例,並探討了其在電子商務和行銷方面的潛力。
[編者註]
AI影像生成技術正從一次性方法發展成為可以重複修改的合作夥伴。你是否曾經想要修改作品中的某些內容,但又放棄了從頭開始的念頭?
最新的技術進步將大大降低試錯的難度。我們正邁向一個新時代,在這個時代,即使是非設計專業人士也能將他們的想法視覺化,並不斷完善直至滿意。
您打算如何使用這項技術?雖然它為創意表達開啟了新的可能性,但您或許也會擔心真假界線的模糊。我們很想聽聽您的想法。