影片製作民主化還是深度偽造技術的氾濫? TurboDiffusion 的優缺點:速度提升 200 倍的 AI 技術 影片製作民主化還是深度偽造技術的氾濫? TurboDiffusion 的優缺點:速度提升 200 倍的 AI 技術

影片製作民主化還是深度偽造技術的氾濫? TurboDiffusion 的優缺點:速度提升 200 倍的 AI 技術

影片製作民主化還是深度偽造技術的氾濫? TurboDiffusion 的優缺點:速度提升 200 倍的 AI 技術

由聖書科技、清華大學和加州大學柏克萊分校的研究人員發布的 AI 影片生成技術TurboDiffusion ,可以在不降低品質的前提下,以比現有方法快 200 倍的速度生成影片

搭載英偉達RTX 5090顯示卡的PC可以將產生一段5秒影片的時間縮短至1.9秒。這項技術的開源發布使得在消費級PC上產生高品質影片成為可能,但也引發了人們的擔憂,即它可能使大規模製作深度偽造影片和虛假資訊變得更加容易。

影片製作的民主化有可能為創意產業帶來重大變革,使以前需要專業知識和昂貴設備的影片製作變得人人都能輕鬆上手。

另一方面,也有人擔心,難以確定真實性的內容的氾濫會對資訊的可靠性構成社會風險。

從: 文献リンク這項新技術只需幾秒鐘即可產生人工智慧影片。

【社論】

大幅降低影片製作門檻。由清華大學、聖書科技和加州大學柏克萊分校於2025年12月23日聯合發布的TurboDiffusion技術,不僅是一項技術突破,更有可能為我們的社會帶來重大變革和顛覆。

創意產業的劇變

受影響最大的是影片創作者:以前製作一段五秒鐘的高清影片需要近 80 分鐘的處理時間,而 TurboDiffusion 將這一時間縮短至24 秒。乍一看,這似乎是生產力的巨大飛躍,但另一方面,這也意味著不再需要專業技能和昂貴的設備投資。

影片製作公司、動畫工作室、廣告公司以及其他憑藉專業知識和資本投入建立起競爭優勢的公司,將被迫從根本上重新思考其商業模式。同時,這對個人創作者和新創公司來說是一個絕佳的機會。我們正在進入一個任何人只要有想法就能製作專業級影片內容的時代。

打擊假訊息的鬥爭進入新階段

然而,這項技術的普及也帶來了嚴重的社會風險。其中最令人擔憂的是深度偽造影片和虛假資訊的大量生產。深度偽造影片造成的詐欺和誹謗已然是一個社會問題,但如果生成速度加快200倍,這種威脅將會倍增。

政客的假演講影片、冒充企業高層的詐欺影片、名人的假新聞——在資訊爆炸、瞬息萬變的環境下,真假之間的界線變得日益模糊。諸如選舉期間散佈候選人醜聞視頻,或試圖操縱股價而傳播公司虛假公告視頻等場景,已不再是天方夜譚。

正如文章所指出的,「人工智慧垃圾內容」問題也十分嚴重。 TikTok、YouTube 和 Instagram 等社群媒體平台已經充斥著大量低品質的人工智慧生成內容。如果 TurboDiffusion 進一步降低內容生成成本,可能會導致大量無意義的影片被發布,從而掩蓋真正有價值的內容。

媒體素養的重要性日益凸顯

在這種情況下,我們每個人都必須具備較高的媒體素養。 「影片就是真的」這種常識性的想法已經不再適用。核實資訊來源、交叉驗證多個資訊來源、仔細觀察是否存在任何異常行為等基本技能比以往任何時候都更重要。

尤其令人擔憂的是其對老年人和兒童的影響。即使是數位原住民世代也難以辨別人工智慧生成內容的真假,而資訊素養相對較低的人群更容易成為假訊息的受害者。教育領域亟需採取相應措施。

監管和平台責任

技術發展速度明顯落後法律法規的製定。儘管日本在2024年推出了一些針對深度偽造技術的法規,但目前仍缺乏針對人工智慧生成影片的全面法律架構。各國呼籲採取類似歐盟人工智慧監管法的綜合性方案。

同時,YouTube、Meta和TikTok等平台公司也必須負責。確保人工智慧生成內容的透明度(強制標註)、加強驗證系統以及及時刪除惡意內容都是至關重要的措施。然而,目前各平台仍在摸索解決方案,Meta的AI視訊應用「Vibes」在歐洲的日活躍用戶僅為2.3萬人,便是一個例證。

產業結構調整新增就業

另一方面,TurboDiffusion 有潛力創造新的產業和就業機會。新的市場將會出現,以應對這項技術帶來的挑戰,例如人工智慧生成影片的驗證服務、驗證內容真實性的企業以及媒體素養教育計畫。

在教育領域,這將使製作個人化優化的教學影片變得更加容易,並有望提升學習效果。在醫療領域,這將降低製作患者講解影片和手術模擬影片的成本,從而有助於提高醫療品質。在行銷領域,這將顯著提高A/B測試的效率,從而實現更有效的廣告製作。

開源是一把雙面刃

將TurboDiffusion開源對於科技的民主化而言是一項值得歡迎的進展。讓研究人員和開發者免費存取程式碼能夠加速創新,但也意味著惡意行為者現在也能利用這項技術。

這種矛盾是人工智慧技術發展始終面臨的根本困境。封閉技術會減緩其發展,而開放技術則會增加風險。社會面臨的問題是如何在這兩者之間取得平衡。

社會正處於轉折點

TurboDiffusion 被譽為“DeepSeek 時刻”,但它不僅僅是一個技術轉折點,更是一個社會轉折點,它將從根本上重新審視“看見”的意義、我們“相信”的內容以及“創造”的價值。

各大科技公司也正在開發類似技術,例如 OpenAI 的 Sora、Google的 Flow 和 Adob​​e 的 Firefly。隨著這場競爭日益激烈,我們都需要建構一個能夠最大限度地發揮技術優勢、同時最大限度地降低其風險的社會體系。

[術語]

渦輪擴散
這是由清華大學、聖書科技和加州大學柏克萊分校共同開發的AI視訊生成加速框架。透過將其應用於現有的擴散模型,可以在保持品質的前提下,將速度提高100-200倍。

聖賢關注
這項技術將注意力機制的計算量化為 8 位元整數 (INT8)。它由清華大學 TSAIL 實驗室開發,是業界首個加速低位注意力機制的技術,並已整合到 NVIDIA TensorRT 等主流 GPU 平台中。

SLA(稀疏線性注意力)
一種透過可學習的稀疏注意力機制來減少冗餘計算的技術。與 SageAttention 結合使用時,速度可提升 17-20 倍。

rCM(評分正規化連續時間一致性模型)
一種分步蒸餾技術。它將以前需要100多個步驟的取樣步驟壓縮到3-4個步驟,在保持高品質的同時提高了生產速度。

W8A8 量化<br>一種將模型權重和激活值量化為 8 位元整數的技術,可提高計算速度並減少記憶體使用量。

RTX 5090
NVIDIA 最新一代顯示卡。配備 INT8 Tensor Core,採用低位量化技術,針對高速運算進行了最佳化。

擴散模型<br>一種透過逐步去除雜訊來產生影像和視訊的人工智慧模型。它是許多人工智慧生成工具的底層技術,包括 DALL-E、穩定擴散和 Sora。

深度偽造
利用人工智慧技術創建不存在或篡改的圖像和視訊內容。人們擔憂濫用此類技術會造成社會影響。

人工智慧斜坡
這是指低品質人工智慧生成內容的俚語,指的是網路上充斥著大量無價值內容。

媒體素養<br>批判性地解讀媒體傳播的訊息並辨別其真偽的能力。在人工智慧時代,這種能力變得越來越重要。

[參考連結]

TurboDiffusion GitHub 倉庫(外部)
TurboDiffusion 的官方 GitHub 程式碼庫,其中公開提供程式碼、模型和技術文件。

SageAttention GitHub 倉庫(外部)
SageAttention 技術的官方程式​​碼庫。與 FlashAttention 相比,速度提升 2-5 倍。

聖舒科技官方網站(外部連結)
像Vidu這樣的中國人工智慧公司正在開發先進的人工智慧視訊生成平台。

OpenAI Sora 2 (外部)
OpenAI 最新推出的 AI 模型能夠根據文字生成視頻,同時也具備語音生成功能。

[參考文章]

聖書科技與清華大學聯合發布TurboDiffusion (外部連結)
TurboDiffusion官方新聞稿宣布速度提升100-200倍,並開源。

速度至上:中國研究人員推出近乎即時產生AI影片的新技術(外部連結)
《南華早報》發表了一篇深度技術文章,報導了中國在人工智慧視訊生成技術領域的進展。

TurboDiffusion:將視訊擴散模型的速度提升 100-200 倍(外部連結)
TurboDiffusion 技術論文頁面。其中詳細解釋了 SageAttention、SLA、rCM 和 W8A8 的技術細節。

2025年是人工智慧垃圾產品走向主流的一年(外部)
歐洲新聞台分析了人工智慧垃圾對社會的影響以及平台如何應對。

[編者註]

誰能想到「觀看」影片這件事會變得如此複雜?你眼前的影片是真實的,還是人工智慧生成的?你能信任發送者嗎?資訊來源可靠嗎?我們正迅速邁向一個每天都要被迫做出這類判斷的社會。像TurboDiffusion這樣的技術拓展了創造力的可能性,同時也模糊了真假之間的界線。我們需要的不是恐懼或盲目信任技術,而是以批判的眼光看待它。你會如何決定觀看下一個影片?