
亞馬遜透過 Nova 2、Nova Forge 和 Nova Act 將生成式人工智慧的關鍵組成部分——推理、多模態、語音和代理——整合在一起。
感覺我們終於從「使用」模型的階段過渡到「基於我們自己的業務和服務建立人工智慧堆疊」的階段。
12 月 2 日,亞馬遜發布了四款相容多模式的「Amazon Nova 2」系列產品、「Nova Forge」(允許公司建立自己的前沿「Novella」模型)以及「Nova Act」(瀏覽器 UI 自動化代理服務)。
Nova 2 Lite/Pro 被設計為推理模型,可以處理文字、圖像、視訊和音頻,而 Nova 2 Sonic 處理語音對話,Nova 2 Omni 處理超長上下文的整合多模態處理。
Nova Forge 為訓練前、訓練中和訓練後階段提供 Nova 檢查點和資料混合功能,而 Nova Act 在基於瀏覽器的工作流程中使用在強化學習訓練場中訓練的模型,成功率約為 90%。
從:
亞馬遜推出四款全新Nova Frontier模式、一項開創性的Nova Forge服務(供組織建立自己的模式)以及面向建構代理商的Nova Act。
【社論】
此次公告似乎標誌著AWS正從「出租模式的雲端服務供應商」轉型為「為各公司建置人工智慧工廠提供基礎設施」。 Nova 2系列涵蓋推理、多模態、語音和長文本處理,而Nova Forge和Nova Act則支援在同一平台上使用內部模型和實用代理。
Nova Forge 的「開放式訓練」提供了第三種選擇,既非對現有模型進行表面調整,也非完全從零開始建立內部邏輯學習模型 (LLM)。它允許使用者存取從預訓練到後訓練的各個檢查點,並允許將內部資料與 Nova 生成的資料逐步整合。這使得模型能夠在保留指令追蹤等基本能力的同時,深度嵌入領域知識。對於那些有意建立自有模型但又因成本和人力資源問題而難以邁出第一步的大型企業和政府機構而言,這是一個切實可行的折衷方案。
Nova Act旨在解答智能體在瀏覽器上執行任務的「績效標準」問題,其目標是實現約90%的工作流程成功率。透過使用強化學習訓練器訓練大量的使用者介面操作模式,它可以更輕鬆地應用於依賴現有系統的任務,例如測試自動化、表單輸入和支付驗證,Hertz和1Password等案例便體現了這一點。雖然它尚未達到完全無需人工監督的自主運行階段,但其實際應用水平似乎已達到可以進行「試用部署和投資回報率評估」的程度。
更廣泛的趨勢是,我們不再依賴單一的通用模型來處理所有問題,而是開始建立“內部人工智慧堆疊”,將特定應用的模型與內部開發的Novella和代理平台相結合。這一趨勢與歐洲、美國和亞洲的自主人工智慧和政府模型運動密切相關,在日本,類似的話題也日益增多,包括政府公開呼籲使用邏輯邏輯模型(LLM)。在這種背景下,模型效能比較不僅會變得更加重要,負責任的人工智慧、稽核和安全性也將成為決定是否採用某個系統的重要因素。
對於 innovaTopia 的讀者來說,關鍵問題是:「如何將您的公司或產品轉型為代理或 Novella?」 您會簡單地將目前由用戶在螢幕前完成的日常任務交給瀏覽器代理嗎?還是會將您專業團隊的隱性知識融入 Novella?抑或,您會重新設計客戶接點的多模式體驗嗎?我們即將迎來這樣一個時代:您所取得的成就以及所需的準備工作(數據準備和業務設計)將因您採取的行動而大相徑庭。
[術語]
前沿模型<br>指具有尖端效能和規模的基礎人工智慧模型,使用大規模資料和運算資源進行訓練。
多模態<br>指人工智慧模型能夠以整合的方式處理多種類型的數據,例如文字、圖像、音訊和視訊。
上下文視窗<br>指模型一次可以處理和保存的標記數量;數值越大,處理長對話和句子就越容易。
強化學習
它是一種機器學習方法,其中智能體透過與環境的互動來學習最大化獎勵的行動方案。
健身房
強化學習模擬環境的通用術語,其中智能體透過反覆執行任務來學習。
基於瀏覽器的使用者介面工作流程
它指的是透過螢幕執行的一系列業務流程,例如填寫表格和操作網頁瀏覽器上的按鈕。
基於代理的人工智慧
這是一個通用術語,指的是能夠自主分解和執行任務,同時調用外部工具和應用程式的人工智慧系統。
[參考連結]
Amazon Bedrock (外部)
它是一項託管服務,透過 API 提供多種前沿模型,使公司能夠安全、可擴展地建立生成式 AI 應用程式。
Amazon Nova (外部)
這是一組針對推理、多模態、語音對話等的 AI 模型,涵蓋從文字到圖像、音訊和視訊的廣泛應用場景。
Amazon Nova Forge (外部)
這項服務允許公司建立自己的 Novella 模型,並提供將 Nova 檢查點與自己的數據結合的開放式培訓。
亞馬遜新星法案(外部)
這是一個專門用於自動化瀏覽器上 UI 工作流程的代理服務,旨在基於 Nova 2 Lite 實現較高的任務成功率。
思科(外部)
這是一家提供網路設備和安全解決方案的全球性公司,致力於為企業網路和資料中心開發產品。
西門子(外部)
這是一家德國大型企業,主要經營工業和醫療設備,同時也專注於製造業數位化和工業4.0領域。
Reddit (外部連結)
該公司經營一個以社群為基礎的留言板平台,並提供一個具有主題貼文和投票功能的社群新聞網站。
Booking.com (外部連結)
它提供線上預訂住宿和旅遊產品的服務,並經營一個平台,讓您可以在世界各地搜尋和預訂飯店和交通方式。
1Password (外部)
該公司提供可安全儲存和管理密碼及機密資訊的軟體,並透過瀏覽器擴充功能和其他方式提供登入資訊的自動填入功能。
赫茲(外部)
該公司在全球範圍內開展汽車租賃業務,透過機場和城市地區提供乘用車和商用車租賃服務。
[參考文章]
AWS推出新的Nova AI模式和一項讓客戶擁有更多控制權的服務(外部通報)
TechCrunch 的一篇文章概述了 Nova 2 系列,解釋了 Nova Forge 如何透過檢查點存取和資料混合為公司提供更大的控制權,以及 Nova Act 如何應用於瀏覽器自動化。
AWS推出Nova Forge,用於訓練客製化的「Novella」前沿模型(外部連結)
SiliconANGLE 重點介紹了 Nova Forge,並詳細介紹了其技術特性,例如為預階段、中階段和後階段提供檢查點、強化學習訓練營和知識提煉,以及為構建自己的前沿模型類 Novella 的公司提供的戰略背景。
使用現已正式發布的 Amazon Nova Act 建立可靠的 AI 代理,實現 UI 工作流程自動化(外部連結)
AWS 官方部落格介紹了 Nova Act 如何利用強化學習和模擬環境,在自動化瀏覽器 UI 工作流程方面實現了約 90% 的成功率,並介紹了 Hertz 和 1Password 的案例研究。
AWS re:Invent 2025 的主要公告(外部連結)
這篇官方部落格總結了 re:Invent 2025 的主要公告,並概述了 AI 相關服務的定位,包括 Nova 2 系列、Nova Forge 和 Nova Act,以及它們在 AWS 整體策略中的作用。
借助 Nova Forge,AWS 為企業提供了一條建立基礎層級模型的途徑(外部連結)。
VentureBeat 的一篇文章解釋說,Nova Forge 為公司提供了一種構建前沿模型的新選擇,並從商業角度解釋了它與現有的微調和構建自己的 LLM 有何不同。
[編者註]
現在您是否對可以在瀏覽器另一端嘗試將這股浪潮應用於哪種類型的業務或服務有了更清晰的認識?像 Nova 2、Nova Forge 和 Nova Act 這樣的系統並非只適用於專門從事人工智慧的公司;關鍵在於您如何將它們很好地融入日常工作流程和產品設計中。
如果你或你的團隊的工作中存在一些每天只需對著螢幕重複執行的任務,那麼這些任務非常適合採用智能體或Novella等技術。如果我們能夠共同努力,確定哪些流程應該交給人工智慧,哪些流程應該繼續由人類主導,那將是一件非常令人安心的事情。