谷歌訴SerpApi案:人工智慧時代圍繞搜尋抓取展開的資料戰爭 谷歌訴SerpApi案:人工智慧時代圍繞搜尋抓取展開的資料戰爭

谷歌訴SerpApi案:人工智慧時代圍繞搜尋抓取展開的資料戰爭

谷歌訴SerpApi案:人工智慧時代圍繞搜尋抓取展開的資料戰爭

2025 年 12 月 19 日,Google對位於德州的網路爬蟲公司 SerpApi 提起訴訟,指控 SerpApi 違反了《數位千禧年版權法》,繞過了保護Google搜尋結果中顯示的受版權保護內容的安全措施。

根據投訴,SerpApi 每天發送數億個自動化的虛假搜尋請求,在過去兩年中,這一數字增加了高達 25,000%。

他們繞過了Google於 2025 年 1 月推出的名為 SearchGuard 的安全技術,未經許可獲取並轉售授權內容,例如知識面板中的圖像、Google購物和Google地圖資料。

谷歌正在尋求對每次規避行為處以 200 美元至 2500 美元的法定賠償,並要求法院頒布禁令。

SerpApi 的年收入估計達數百萬美元,但其潛在負債要大得多。

從: 文献リンク我們為何要對SerpApi的非法抓取行為採取法律行動

【社論】

谷歌起訴 SerpApi 的這起案件,代表了人工智慧時代資料存取權激烈鬥爭的前線。

SearchGuard:一道新的防線

SearchGuard 是Google於 2025 年 1 月推出的安全技術,耗費了數萬工時和數百萬美元的資金研發。它使用 JavaScript 挑戰來判斷搜尋查詢是來自自動化系統還是真人使用者。合法用戶的瀏覽器可以輕鬆通過挑戰,但自動化抓取工具通常無法存取該挑戰。

然而,SerpApi很快就開發出一種繞過這種技術的方法。根據訴狀,該公司創建了虛假瀏覽器,並使用多個IP位址來偽裝成普通用戶,包括偽造設備資訊和軟體詳情。

人工智慧時代的數據爭奪戰

這場訴訟源自於訓練生成式人工智慧模型所需大量資料的競爭。像SerpApi這樣的網路爬蟲服務在為人工智慧公司提供所需的結構化搜尋資料方面發揮了關鍵作用。它們高達每月5000美元的訂閱費,也反映了市場對這些數據的巨大需求。

有趣的是,這並非個案。 2025年10月,Reddit以類似理由起訴了四家公司-SerpApi、Perplexity、Oxylabs和AWMProxy。 Reddit用「無法進入金庫的銀行搶匪轉而襲擊運鈔車」來比喻這些公司,聲稱它們繞過了Reddit的反抓取措施和谷歌的SearchGuard來竊取資料。

商業模式的根本問題

谷歌的投訴稱SerpApi的商業模式是「寄生性的」。該公司提供名為「Google搜尋API」的服務,但谷歌官方並未提供此類API。換句話說,投訴指控SerpApi向Google搜尋引擎出售「後門」。

更嚴重的是,SerpApi 未經許可擅自獲取了谷歌已從第三方獲得授權的受版權保護的內容。例如,用於知識庫的高解析度圖片、用於Google購物的產品資訊、用於Google地圖的評論以及其他內容,這些都是Google付費購買授權的。 SerpApi 未經許可取得並轉售這些內容,不僅威脅到原始內容提供商,也威脅到Google的授權協議。

法律策略的轉折點

谷歌在此案中的法律策略之所以引人注目,是因為它主要不是基於違約,而是基於違反《數位千禧年版權法案》(DMCA) 第 1201 條,該條款禁止規避控制對受版權保護作品存取的技術措施。

谷歌將 SearchGuard 歸類為“技術保障措施”,這是一種前所未有的法律手段,旨在將 DMCA 保護應用於搜尋結果等動態生成的內容。如果獲得批准,這將為平台安全措施的法律保護樹立新的標準。

賠償的現實

投訴中有一句很有意思的話:谷歌聲稱「SerpApi 無法支付法定賠償金」。雖然 SerpApi 的年收入高達數百萬美元,但每次規避行為的法定賠償金可能高達 200 至 2500 美元,考慮到每天數億次的違規行為,這將是一筆天文數字。

這意味著訴訟的主要目的並非尋求經濟賠償,而是徹底關閉SerpApi的業務。訴訟請求法院頒布禁令,禁止該公司使用其規避技術,並強制其銷毀現有技術和資料集。

對搜尋引擎優化產業的影響

這場訴訟在搜尋引擎優化(SEO)行業引起了巨大反響,因為許多SEO和行銷分析工具都依賴SerpApi等服務來獲取搜尋引擎結果頁面(SERP)數據。如果Google勝訴,取得可靠的SERP數據可能會變得更加困難和昂貴。

然而,批評人士表示,在人工智慧時代,谷歌正試圖進一步限制搜尋透明度,這可能會讓企業更難了解自己在搜尋結果中的排名和衡量其成功,而與此同時,像「人工智慧概覽」這樣的功能已經減少了點擊量。

更廣泛的背景

該訴訟凸顯了數據訪問生態系統中的一個裂縫:SerpApi 的服務通過填補谷歌受限 API 的空白為無數應用程式提供支持,但谷歌聲稱這破壞了其自身在爬蟲和索引方面的投資。

此外,2025年9月,彭斯克媒體公司(Penske Media Corporation)對Google提起反壟斷訴訟,指控該公司強迫出版商無償為其人工智慧系統提供內容。這些訴訟表明,人工智慧的興起正在凸顯圍繞資料所有權、存取權限和貨幣化的根本性問題。

SerpApi先前曾辯稱“公共搜尋資料應公開”,並認為其活動受美國憲法第一修正案保護。然而,Google的立場是,問題的關鍵不在於資料的公開性,而是在於繞過安全措施,未經許可將受版權保護的內容用於商業用途。

本案的結果有可能重新定義數位時代平台、資料抓取服務、人工智慧公司以及最終用戶的資料存取規則。

[術語]

DMCA(數位千禧年版權法案)
1998 年美國版權法旨在加強數位時代的版權保護。其中第 1201 條特別禁止規避控製版權作品存取的技術措施。

《數位千禧年版權法案》(DMCA)第1201條<br>本條禁止規避控制受版權保護內容存取的技術措施。它既禁止規避行為本身,也禁止製造和銷售能夠實現此類規避的技術。法定賠償金額為每次違規200美元至2500美元。

SearchGuard
谷歌於 2025 年 1 月推出了一項安全技術。該技術使用 JavaScript 驗證來判斷搜尋查詢是來自自動化系統還是人類使用者。合法使用者的瀏覽器可以輕鬆解決這個問題,但自動化抓取工具則無法存取該查詢。

網路爬蟲
這項技術可以自動從網站提取資料。雖然它有合法的用途(例如搜尋引擎抓取、價格比較等),但未經授權的大規模資料收集可能會引發法律問題。

驗證碼
一種用於區分計算機和人類的自動化測試。它用於保護網站免受自動機器人的攻擊。它可以採用多種形式,例如扭曲的字元輸入或影像選擇。

知識面板
出現在 Google 搜尋結果右側的資訊框,顯示有關人物、地點、組織或作品的結構化訊息,通常包含從第三方獲得許可的高品質圖像和數據。

robots.txt
放置在網站根目錄下的一個文件,用於告知搜尋引擎爬蟲可以抓取網站的哪些部分,不可以抓取哪些部分。這是業界標準爬蟲協議的一部分。

[參考連結]

SerpApi 官方網站(外部連結)
一家位於德州奧斯汀的網路爬蟲 API 公司,由 Julien Khaleghy 於 2017 年創立。

谷歌官方部落格-關於SerpApi訴訟案的聲明(外部連結)
谷歌總法律顧問就SerpApi訴訟案的原因和背景所作的官方解釋。

Google訴SerpApi案(PDF) (外部連結)
這份長達 13 頁的完整起訴書已提交至美國加州北區地方法院,詳情如下。

美國版權局 – DMCA 第 1201 條資訊頁面(外部連結)
關於《數位千禧年版權法》第 1201 條的官方資訊和以往的規則制定程序。

[參考文章]

谷歌起訴SerpApi,指控其抓取搜尋結果(外部連結)
對該投訴的詳細分析:每天有數億次虛假搜索,過去兩年增長了 25000%。

谷歌就搜尋內容抓取版權問題起訴SerpApi (外部連結)
詳細解讀SearchGuard技術及法律策略。報告涉及法定賠償。

谷歌起訴SerpApi,指控其抓取並轉售搜尋資料(外部連結)
分析對 SEO 產業的影響,並指出如果Google贏得訴訟,取得 SERP 數據可能會變得更加困難。

Reddit起訴Perplexity和SerpApi,指控其抓取Google搜尋資料(外部連結)
2025年10月22日,Reddit訴訟案報告。解釋了針對包括SerpApi在內的四家公司的訴訟案的來龍去脈。

從搜尋引擎優化到人工智慧搜尋:SerpApi 如何成為開發者通往生成式人工智慧的橋樑(外部連結)
SerpApi的創立故事。了解該公司2017年的發展歷程及其對美國憲法第一修正案的承諾。

《數位千禧年版權法案》( DMCA)中的反規避條款(外部連結)
對《數位千禧年版權法案》(DMCA)第 1201 條的法律架構進行詳細解釋。闡明民事和刑事處罰的範圍。

[編者註]

此案引發了關於如何處理網路數據的根本性問題。谷歌與SerpApi之間的衝突不僅僅是公司間的法律糾紛,它像徵著人工智慧快速發展所引發的日益激烈的資料爭奪戰,並凸顯了一個影響我們所有人的挑戰:如何在開放的網路和智慧財產權保護之間取得平衡。

SerpApi 聲稱擁有“訪問公共搜尋資料的權利”,而谷歌則試圖保護“受版權保護的內容和商業模式”,這兩點似乎都有道理。然而,此案的結果可能會對從搜尋引擎優化工具的可用性到人工智慧發展的本質,乃至網路的未來產生深遠的影響。您如何看待資料存取自由與權利保護之間的平衡?