編輯評論

這篇文章標誌著網路安全歷史上一個危險卻必要的轉折點。Anthropic 公開承認其未發布的 Mythos 2 Preview 模型已經能夠自主發現並利用所有主流作業系統和瀏覽器中的零日漏洞,這在某種程度上等同於將「網路武器化」的能力從少數精英駭客手中,擴散到任何能夠存取先進 AI 模型的行為者。

從技術角度看,這項發現有三個深遠影響。首先,它證明了前沿 AI 模型在程式碼推理和漏洞挖掘能力上已經超越了絕大多數人類專家—Mythos Preview 甚至在 OpenBSD 中發現了一個存活 27 年的漏洞,在 FFmpeg 中找到了被自動化測試工具執行 500 萬次都未發現的問題。這意味著傳統依賴人工審查和靜態分析工具的安全開發流程已經失效。其次,AI 驅動的攻擊將大幅縮短「漏洞發現到被利用」的時間窗口—從過去的數月縮短到數分鐘,這要求防禦者必須從被動應對轉向預防式安全。最後,開源軟體維護者長期缺乏資源進行安全審查的問題更加突出,因為全球關鍵基礎設施中絕大多數程式碼來自開源專案,而這些維護者往往沒有專業安全團隊的支援。

Project Glasswing 的產業合作模式值得肯定,但也引發了更深層的問題。Anthropic 承諾提供 1 億美元的模型使用額度,並邀請 AWS、Google、Microsoft、CrowdStrike、NVIDIA 等十三家組織共同參與,這有助於將先進的 AI 安全能力交到防禦者手中。然而,這些組織本身就是 AI 能力的主要供應商,這種「技術精英俱樂部」式的合作可能加劇數位鴻溝—小型開源專案、發展中國家的關鍵基礎設施營運商,是否能公平獲得相同的防禦工具?此外,Anthropic 表示不會公開發布 Mythos Preview,而是計劃在未來的 Claude Opus 模型中加入防護機制,這意味著最強大的 AI 安全能力將始終受控於少數公司,這是否符合開源社群「安全應該普及化」的理念?

從投資和創業角度來看,這篇文章揭示了三個明確的趨勢。第一,AI 輔助的網路安全測試市場將快速成長,能夠整合 LLM 進行自動化滲透測試、漏洞掃描和修補的創業公司將受歡迎。第二,開源軟體供應鏈安全成為新興投資主題—從 Anthropic 捐款 400 萬美元給 Linux Foundation、Apache Foundation 等組織可以看出,產業界正在嘗試透過資金注入來解決長期被忽視的開源維護者資源問題。第三,能夠提供「AI 輸出防護」的技術公司將有機會—既然 Mythos Preview 已經能夠生成攻擊性程式碼,那麼能夠偵測並封鎖這類輸出的安全層將成為必需品。值得注意的是,這場 AI 與網路安全的軍備競賽才剛開始,Anthropic 提到「frontier AI 能力在接下來幾個月內就可能大幅進步」,這意味著今天看似足夠的防禦措施,可能在半年後就變得過時。

結論摘要

  • AI 模型的網路攻擊能力已跨越關鍵閾值:Anthropic 的 Mythos 2 Preview 能夠自主發現並利用主流作業系統和瀏覽器中的零日漏洞,其能力已超越絕大多數人類安全專家。

  • Project Glasswing 是產業集體防禦的嘗試:Anthropic 牽頭召集 AWS、Google、Microsoft、NVIDIA 等十三家科技巨頭,承諾提供 1 億美元模型使用額度和 400 萬美元捐款,讓防禦者優先獲得 AI 安全能力。

  • 從被動防禦轉向預防式安全勢在必行:AI 將「漏洞發現到被利用」的時間窗口從數月縮短至數分鐘,傳統依賴人工審查的安全流程已經失效,組織必須立即升級網路安全堆疊。

  • 開源軟體的安全維護成為產業痛點:全球關鍵基礎設施中絕大多數程式碼來自開源專案,但維護者長期缺乏資源進行安全審查,Project Glasswing 專門撥款支援開源安全組織。

  • AI 與網路安全的軍備競賽才剛開始:Anthropic 預告前沿 AI 能力在未來幾個月內可能大幅進步,這意味著今天看似足夠的防禦措施可能在半年後就過時,政府和產業界需要持續投資 AI 安全研究。

原文翻譯

Glasswing 專案:守護 AI 時代的關鍵軟體安全

專案啟動

今天,我們宣佈啟動 Project Glasswing,這是一項匯集 Amazon Web Services、Anthropic、Apple、Broadcom、Cisco、CrowdStrike、Google、JPMorganChase、Linux Foundation、Microsoft、NVIDIA 和 Palo Alto Networks 等組織的新倡議,共同守護全球最重要的軟體系統。

我們成立 Project Glasswing 的原因,是觀察到 Anthropic 訓練的一款新型前沿模型展現了重塑網路安全的潛力。Claude Mythos 2 Preview 是一款通用、尚未發布的前沿模型,它揭示了一個殘酷的事實:AI 模型的程式設計能力已經達到能夠超越絕大多數人類(除了最頂尖的專家)在發現和利用軟體漏洞方面的水平。

Mythos Preview 已經發現了數千個高嚴重性漏洞,包括在所有主流作業系統和網頁瀏覽器中的漏洞。考慮到 AI 的發展速度,這類能力很快就會擴散,甚至可能落到那些不會謹慎部署它的行為者手中。這對經濟、公共安全和國家安全的後果可能非常嚴重。Project Glasswing 是一個緊急的嘗試,目的是將這些能力用於防禦目的。

作為 Project Glasswing 的一部分,上述啟動合作夥伴將在其防禦性安全工作中使用 Mythos Preview;Anthropic 將分享我們學到的經驗,讓整個產業受益。我們還擴大了存取權限,讓另外 40 多個建構或維護關鍵軟體基礎設施的組織能夠使用該模型來掃描和保護自有系統和開源系統。Anthropic 承諾為這些工作提供高達 1 億美元的 Mythos Preview 使用額度,以及 400 萬美元直接捐贈給開源安全組織。

Project Glasswing 只是個起點。沒有任何一個組織能夠單獨解決這些網路安全問題:前沿 AI 開發者、其他軟體公司、安全研究人員、開源維護者和世界各國政府都扮演著不可或缺的角色。守護全球網路基礎設施的工作可能需要數年時間;而前沿 AI 能力很可能在接下來幾個月內就會大幅進步。為了讓網路防禦者佔據上風,我們需要立即採取行動。

AI 時代的網路安全

我們每天都依賴的軟體—負責運行銀行系統、儲存病歷、連結物流網路、維持電網運作等等—一直都包含著錯誤。許多是微不足道的,但有些是嚴重的安全缺陷,一旦被發現,就可能讓網路攻擊者劫持系統、中斷運營或竊取數據。

我們已經看到了網路攻擊對重要的企業網路醫療系統能源基礎設施交通樞紐以及世界各地政府機構資訊安全造成的嚴重後果。在全球舞台上,來自中國、伊朗、北韓和俄羅斯等行為者的國家資助攻擊已經威脅要破壞支撐平民生活和軍事準備的基礎設施。即使是規模較小的攻擊,例如針對個別醫院學校的攻擊,仍然可能造成巨大的經濟損失、暴露敏感數據,甚至危及生命。目前全球網路犯罪的財務成本難以估計,但可能約為每年 5000 億美元

軟體中的許多缺陷多年來一直未被注意到,因為發現和利用它們需要只有少數熟練的安全專家才掌握的專業知識。隨著最新的前沿 AI 模型出現,發現和利用軟體漏洞的成本、努力和專業知識水平都大幅下降了。過去一年來,AI 模型在閱讀和推理程式碼方面變得越來越有效—特別是,它們展現出了發現漏洞並找出利用方法的驚人能力。Claude Mythos Preview 展現了這些網路技能的飛躍—它發現的漏洞有些在數十年的人工審查和數百萬次自動化安全測試中倖存下來,而且它開發的利用方法越來越複雜精巧。

在首次DARPA 網路大挑戰十年後,前沿 AI 模型現在在發現和利用漏洞方面已經能夠與最優秀的人類相媲美。如果沒有必要的防護措施,這些強大的網路能力可能被用來利用全球最重要軟體中的許多現有缺陷。這可能使各類網路攻擊變得更加頻繁和具破壞性,並增強美國及其盟國的對手的實力。因此,解決這些問題是民主國家的重要安全優先事項。

儘管 AI 輔助網路攻擊的風險嚴重,但我們有理由保持樂觀:同樣讓 AI 模型在錯誤手中變得危險的能力,也使它們成為發現和修補重要軟體缺陷的無價之寶—並且能夠生產具有更少安全錯誤的新軟體。Project Glasswing 是讓防禦者在即將到來的 AI 驅動的網路安全時代獲得持久優勢的重要一步。

使用 Claude Mythos Preview 發現漏洞和利用方法

在過去幾週中,我們使用 Claude Mythos Preview 發現了數千個零日漏洞(即軟體開發者之前不知道的缺陷),其中許多是嚴重的,遍及所有主流作業系統和所有主流網頁瀏覽器,以及一系列其他重要軟體。

在我們的Frontier Red Team 部落格上,我們提供了一部分已經修補的漏洞的技術細節,在某些情況下,還提供了 Mythos Preview 找到的利用方法。它能夠幾乎完全自主地發現所有這些漏洞—並開發許多相關的利用方法—而無需任何人工引導。以下是三個例子:

  • Mythos Preview 在 OpenBSD 中發現了一個 27 年的漏洞—OpenBSD 被認為是世界上最安全強化的作業系統之一,被用於運行防火牆和其他關鍵基礎設施。該漏洞允許攻擊者只需連接到運行該作業系統的任何機器就能遠程使其崩潰;
  • 它還在 FFmpeg 中發現了一個 16 年的漏洞—FFmpeg 被無數軟體用於編解碼視頻—在一行被自動化測試工具擊中了 500 萬次但從未發現問題的程式碼中;
  • 該模型自主發現並將 Linux 內核(運行世界上大多數伺服器的軟體)中的幾個漏洞串聯在一起,允許攻擊者從普通用戶存取權限升級到對機器的完全控制。

我們已經向相關軟體的維護者報告了上述漏洞,它們現在都已被修補。對於許多其他漏洞,我們今天提供詳細資料的密碼學雜湊(見 Red Team 部落格),我們將在修復措施到位後揭露具體細節。

CyberGym 等評估基準強化了 Mythos Preview 和我們次優模型 Claude Opus 4.6 之間的巨大差異:

網路安全漏洞重現

  • Mythos Preview:83.1%
  • Opus 4.6:66.6%

除了我們自己的工作外,許多合作夥伴已經使用 Claude Mythos Preview 幾週了。以下是他們的發現:

Cisco 高副總裁兼客戶經驗官 Jeetu Patel:「AI 能力已經跨越了一個閾值,從根本上改變了保護關鍵基礎設施免受網路威脅所需的緊迫性,沒有回頭路了。我們在這些模型上的基礎工作表明,我們能夠以前所未有的速度和規模識別和修補硬體和軟體中的安全漏洞。這是一個深刻的轉變,也是一個明確的信號,表明舊的強化系統的方法已經不再足夠。技術提供商必須現在就積極採用新方法,客戶也需要準備部署。這就是 Cisco 加入 Project Glasswing 的原因—這項工作太重要、太緊急了,不能單獨進行。」

AWS 首席資訊安全官 CJ Moses:「在 AWS,我們在威脅出現之前就建立防禦,從我們的客製化晶片到整個技術堆疊。對我們來說,安全不是一個階段;它是連續的,嵌入在我們所做的一切中。我們的團隊每天分析超過 400 萬億個網路流量以尋找威脅,AI 是我們大規模防禦能力的核心。我們已經在自己的安全營運中測試 Claude Mythos Preview,將其應用於關鍵程式碼庫,它已經幫助我們強化程式碼。我們正在將深厚的安全專業知識帶入我們與 Anthropic 的合作夥伴關係,並幫助強化 Claude Mythos Preview,以便更多組織能夠以設定標準的安全性推進他們最雄心勃勃的工作。」

Microsoft 網路安全與研究執行副總裁 Igor Tsyganskiy:「當我們進入網路安全不再受純粹人類能力限制的階段時,負責任地使用 AI 來大規模提高安全性和降低風險的機會是前所未有的。加入 Project Glasswing,存取 Claude Mythos Preview,使我們能夠及早識別和緩解風險,並增強我們的安全和開發解決方案,以便我們能夠更好地保護客戶和 Microsoft。在我們的開源安全基準 CTI-REALM 上測試時,Claude Mythos Preview 與之前的模型相比顯示出實質性改進。我們期待與 Anthropic 和更廣泛的產業合作,改善所有人的安全結果。」

CrowdStrike 首席執行官 George Kurtz:「漏洞被發現和被對手利用之間的窗口已經崩潰—過去需要數月的時間現在在 AI 的幫助下幾分鐘內就能發生。Claude Mythos Preview 展示了大規模防禦者現在可以實現的目標,而對手將不可避免地尋求利用相同的能力。這不是減慢速度的理由;這是我們更快一起行動的理由。如果你想部署 AI,你需要安全。這就是 CrowdStrike 從第一天起就參與這項工作的原因。」

Linux Foundation 執行總裁 Jim Zemlin:「過去,安全專業知識是擁有大型安全團隊的組織的奢侈品。開源維護者—其軟體支撐著世界上大部分關鍵基礎設施—歷史上一直靠自己解決安全問題。開源軟體構成了現代系統中絕大多數的程式碼,包括 AI 代理用來編寫新軟體的系統。通過讓這些關鍵開源程式碼庫的維護者能夠存取新一代能夠主動識別和大規模修補漏洞的 AI 模型,Project Glasswing 提供了一個改變這一等式的可靠途徑。這就是 AI 輔助安全可以成為每個維護者的可信賴副手的方式,而不僅僅是那些負擔得起昂貴安全團隊的人。」

JPMorganChase 首席資訊安全官 Pat Opet:「促進金融系統的網路安全和韌性是 JPMorganChase 的核心使命,我們相信當領先機構在共同挑戰上合作時,產業最強。Project Glasswing 提供了一個獨特的早期階段機會,可以按照我們自己的條件以及與受人尊敬的技術領導者一起,評估用於關鍵基礎設施防禦性網路安全的下一代 AI 工具。我們將採用嚴謹、獨立的方法來確定如何前進以及我們可以提供幫助的地方。Anthropic 的倡議反映了這個時刻所要求的前瞻性、協作方式。」

Google 副總裁兼 Google Defense 副總裁 Royal Hansen:「Google 很高興看到這個跨產業的網路安全倡議聚在一起,並通過 Vertex AI 向參與者提供 Mythos Preview。產業在出現安全問題時總是至關重要的,無論是後量子密碼學、負責任的零日披露、安全開源軟體,還是防禦基於 AI 的攻擊。我們長期相信 AI 在網路防禦方面帶來了新的挑戰和機會,這就是我們建構了 AI 驅動的工具(如 Big Sleep 和 CodeMender)來發現和修補關鍵軟體缺陷的原因。我們將繼續投資我們領先的網路安全平台和專注於保護用戶、客戶、生態系統和國家安全的文化。」

Palo Alto Networks 首席技術官 Nir Zuk:「過去幾週,我們能夠存取 Claude Mythos Preview 模型,使用它來識別前一代模型完全錯過的複雜漏洞。這不僅是發現以前隱藏漏洞的遊戲規則改變者,它也標誌著一個危險轉變,攻擊者很快就能找到更多的零日漏洞並比以往任何時候都更快地開發利用方法。很明顯,這些模型需要交到開源所有者和各地的防禦者手中,以便在攻擊者獲得存取權之前發現和修補這些漏洞。可能更重要的是:每個人都需要準備應對 AI 輔助的攻擊者。將會有更多的攻擊、更快的攻擊和更複雜的攻擊。現在是時候讓各地的網路安全堆疊現代化了。我們讚賞 Anthropic 與產業合作,確保這些強大的能力優先考慮防禦。」

Mythos Preview 的程式設計與推理能力

Claude Mythos Preview 的強大網路能力是其強大的代理程式設計和推理技能的結果。例如,如下面的評估結果所示,該模型在各種軟體程式設計任務上獲得了迄今為止開發的任何模型的最高分數。

SWE-bench Verified、Pro 和 Multilingual:我們的記憶篩選標記了這些 SWE-bench 評估中的一部分問題。排除任何顯示記憶跡象的問題,Mythos Preview 相對於 Opus 4.6 的改進優勢保持不變。

SWE-bench Multimodal:我們對 Mythos Preview 和 Opus 4.6 都使用了內部實現。分數不能直接與公開排行榜分數相比較。

Terminal-Bench 2.0:我們使用 Terminus-2 配合自適應思考和最大努力,以及每個任務 100 萬個 token 的總任務預算。所有實驗使用每個任務平均五次嘗試的 1× 保證/3× 天花板資源分配。當我們將超時限制增加到四小時並使用 Terminal-Bench 2.1 更新時,Mythos Preview 獲得了 92.1% 的分數。

Humanity’s Last Exam:我們發現 Mythos 在低努力下仍然在 HLE 上表現良好,這可能表明某種程度的記憶。

BrowseComp:Claude Mythos Preview 在使用少 4.9 倍 token 的情況下得分高於 Opus 4.6。

有關模型能力、其安全屬性和一般特徵的更多資訊可以在 Claude Mythos Preview 系統卡中找到。

我們不計劃公開發布 Claude Mythos Preview,但我們的最終目標是使我們的用戶能夠安全地大規模部署 Mythos 類模型—用於網路安全目的,也用於這類高度能力模型將帶來的無數其他好處。為此,我們需要在開發網路安全(和其他)防護措施方面取得進展,以偵測和封鎖模型最危險的輸出。我們計劃在即將推出的 Claude Opus 模型中推出新的防護措施,使我們能夠使用不構成與 Mythos Preview 相同風險水平的模型來改進和完善它們。

Project Glasswing 的計劃

今天的公告是一項長期努力的開始。要取得成功,將需要來自科技產業及其他領域的廣泛參與。

Project Glasswing 合作夥伴將能夠存取 Claude Mythos Preview,以發現並修補其基礎系統中的漏洞或弱點—這些系統代表了全球共享網路攻擊面的很大一部分。我們預計這項工作將專注於本地漏洞偵測、二進位檔案的黑盒測試、端點保護和系統滲透測試等任務。

Anthropic 承諾向 Project Glasswing 和額外參與者提供 1 億美元的模型使用額度,將涵蓋這個研究預覽期間的大量使用。此後,Claude Mythos Preview 將以每百萬輸入/輸出 token 25/125 美元的價格提供給參與者(參與者可以通過 Claude API、Amazon Bedrock、Google Cloud 的 Vertex AI 和 Microsoft Foundry 存取該模型)。

除了我們承諾的模型使用額度外,我們還通過 Linux Foundation 向 Alpha-Omega 和 OpenSSF 捐贈了 250 萬美元,向 Apache Software Foundation 捐贈了 150 萬美元,以使開源軟體的維護者能夠應對這個不斷變化的格局(有興趣存取的維護者可以通過 Claude for Open Source 計劃申請)。

我們打算讓這項工作的範圍擴大並持續數月,我們將盡可能多地分享,以便其他組織能夠將這些經驗教訓應用到自己的安全工作中。合作夥伴將在能力範圍內彼此分享資訊和最佳實踐;在 90 天內,Anthropic 將公開報告我們學到的東西,以及可以披露的已修補漏洞和改進。我們還將與領先的安全組織合作,製定一套關於安全實踐應如何在 AI 時代演變的實用建議。這可能包括:

  • 漏洞披露流程;
  • 軟體更新流程;
  • 開源和供應鏈安全;
  • 軟體開發生命週期和安全設計實踐;
  • 受監管行業的標準;
  • 分診擴展和自動化;以及
  • 修補自動化。

Anthropic 還一直在與美國政府官員討論 Claude Mythos Preview 及其攻擊和防禦網路能力。正如我們上面提到的,保護關鍵基礎設施是民主國家的最高國家安全優先事項之一—這些網路能力的出現是美國及其盟國必須在 AI 技術上保持決定性領先的另一個原因。政府在幫助維持這種領先地位以及評估和緩解與 AI 模型相關的國家安全風險方面發揮著至關重要的作用。我們準備與地方、州和聯邦代表合作,協助這些任務。

我們希望 Project Glasswing 能夠在產業和公共部門播下一個更大規模努力的種子,所有各方都有助於解決強大模型對安全影響的最大問題。我們邀請其他 AI 產業成員加入我們,幫助制定產業標準。在中期內,一個獨立的第三方組織—一個能夠將私營和公共部門組織聚集在一起的組織—可能是繼續這些大規模網路安全工作的理想家園。