### [前沿AI网络攻击能力突破阈值：Claude Mythos率先通过32步攻击测试](https://www.willai.cc/article/43)

**Published:** 2026-05-12T23:11:00

**Author:** hiyoho

**Excerpt:** 说出来你可能不信，但AI驱动的网络进攻是遥远未来这个判断，已经被数据彻底推翻了。 AISI的测试结果让人睡不着觉 英国AI安全研究所（AISI）最近做了一件事：他们让Anthropic的Claude Mythos Preview去跑一个32

说出来你可能不信，但AI驱动的网络进攻是遥远未来这个判断，已经被数据彻底推翻了。

## AISI的测试结果让人睡不着觉

英国AI安全研究所（AISI）最近做了一件事：他们让Anthropic的Claude Mythos Preview去跑一个32步的「最后一批」（TLO）测试范围。这个测试范围是什么概念？它是一个模拟企业网络的完整攻击链路，从侦察到完全域控制，通常需要人类红队投入20个小时才能走完。

结果呢？Mythos在10次运行中成功了3次。

说实话，第一次看到这个数据的时候我没太当回事——10次成3次，成功率30%，好像也不怎么样？但AISI的评估接着说：在专家级任务上，Mythos的成功率达到**73%**。

这就很恐怖了。

## OpenAI的GPT-5.5几乎同步追上

更让人不安的是时间线。Claude Mythos公布结果3周后，OpenAI的GPT-5.5公布了几乎完全一致的能力画像：

-   10次端到端测试中成功2次
-   专家级任务成功率71.4%
-   同样存在无防御方的测试限制条件

两个模型的能力曲线几乎重合。这不是巧合，而是前沿AI在网络进攻能力上已经形成了稳定的技术范式。

## 每4个月翻倍意味着什么？

> AISI估计，当前前沿进攻性网络能力**每4个月翻倍**。

等等，这个速度比2025年底的每7个月翻倍还要快。如果按这个速度线性外推（虽然实际是指数增长），到2026年底，前沿AI可能就能在无人干预的情况下完成绝大多数中级红队任务。

我觉得这里有个被严重低估的风险：当前的基准测试如果没有对抗性防御层，根本区分不出前沿模型的能力差异。换句话说，我们可能根本不知道AI在网络进攻上到底有多强，因为我们的测试环境太友好了。

## 传统网络安全厂商的生存危机

这个变化最直接的受害者是谁？是那些依赖静态签名、规则的传统网络安全厂商。

它们的护城河——特征库、规则集、人工分析的专家经验——正在被进攻性AI循环超越。AISI的报告直言不讳：**传统检测手段已经过时了**。

那谁有机会活下来？CrowdStrike、Palo Alto、Microsoft Defender这些集成了XDR平台的厂商，它们掌握着防御智能体所需的编排层。但前提是它们能推出真正的AI原生架构，而不是把传统技术栈包装一下就号称AI驱动。

## 一个值得深思的悖论

这里有个我很在意、但行业讨论不多的悖论：

我们正在用AI来防御AI驱动的网络进攻。但防御AI需要的数据、算力、响应速度，和传统安全工具完全不在一个量级上。这不只是技术升级的问题，而是整个安全行业的基础设施要重构的问题。

而那些手里握着大量防御数据的平台厂商，会不会借此形成新一轮的垄断？

* * *

_参考资料：State of AI: May 2026, Air Street Press, AISI Assessment Report_

**Tags:** AI, 人工智能, 科技趋势, 网络安全

**Categories:** AI资讯

---