最近有个变化正在发生,可能很多人还没注意到——互联网的基础设施,正在从为”人”设计,转向为”机器”设计。
这么说可能有点抽象,具体来看就很有意思了。Cloudflare 的数据显示,过去半年里,非人类流量(主要是爬虫、AI 助手、自动化代理)已经占到整体 HTTP 流量的 31%,其中 AI 爬虫和搜索引擎占了机器人请求的四分之一。Cloudflare 的产品经理 Lai Yi Ohlsen 甚至预测,非人类流量将在 2027 年上半年超过人类流量。
AI 代理的流量模式,彻底打破了旧规则
这背后是 AI 代理(agent)的崛起。和人类用户稳定的浏览、点击、滚动行为不同,AI 代理的行为模式完全不同:它们可以在几秒钟内发起数百次数据库查询、文档检索和 API 调用,然后像出现时一样迅速消失。这种”突发式”的流量模式,是传统云基础设施根本没有设计过的。
“代理会从实验阶段进入生产环境,它们产生的流量模式是之前的基础设施根本没有设计过的。它们会毫无预警地出现流量峰值,也会毫无征兆地进入空闲状态。” — AWS OpenSearch 总经理 Tia White

AWS、微软、Cloudflare 都在重新造轮子
本周 AWS 发布的下一代 OpenSearch Serverless 就是一个典型例子。这个新版本把计算和存储解耦,可以根据代理流量的峰值在几秒内自动扩容,也可以在代理空闲时缩容到零——换句话说,不用为空闲的计算资源付费了。
用个通俗的比喻:以前的 Serverless 版本就像你无论用不用车,都得付固定停车费;新版更像是按实际停放时间计费的智能停车位。
类似的动作在整个云行业都在发生。Databricks 和 Snowflake 正在把自己重新定位为企业 AI 数据的”记忆和检索系统”;微软推出了针对 Azure 的更新,专门处理 AI 代理的流量突发并在代理之间共享记忆;Cloudflare 上个月也推出了面向代理的持久化环境和即时扩展能力的基础设施。
这个趋势值得关注,因为它意味着两件事:一是 AI 代理的规模化部署正在倒逼基础设施升级;二是当这套新基础设施成熟后,代理的部署成本会更低、更容易大规模落地。对于正在考虑用 AI 代理做点什么的公司来说,这是个好消息。
