AI的爆炸性增长,背后是数据中心的大规模扩张。到这个十年结束的时候,美国数据中心的用电量预计会占到全国总量的9%到17%。而今天,数据中心大约有三分之一的电力是花在冷却芯片上的。
这就是Ferveret想要解决的问题。这家公司的名字不太常见,是两个MIT的研究员创办的。其中一个是Reza Azizian,他曾经是MIT核工程方向的博士后;另一个是Matteo Bucci,MIT核科学与工程系的副教授。
从核反应堆到AI芯片
他们做的事情听起来有点跨界:把核反应堆里的热量传递技术,搬到数据中心的芯片冷却上。核反应堆里,怎么把堆芯的热量高效地导出来,直接决定了能发多少电。科学家在这件事上研究了几十年。现在,同样的技术思路被用到了AI芯片上。
Ferveret的方案叫自适应相变冷却(APC)。简单说,就是把服务器整个浸没在一种特殊的液体里。这种液体比风扇吹出来的空气吸热效率高得多。但Ferveret跟别家的浸没式冷却不一样的地方在于气泡——他们的液体在服务器表面产生的小气泡,比别的方案更小,脱离表面的频率也更高,这样热量传递就快得多。
最关键的一点是,这个方案不耗水。传统的数据中心冷却,蒸发水冷要耗掉大量的水。Ferveret用的是一种低沸点的液体,不含那些有毒的PFAS”永久化学物质”,而且根本不需要往系统里加水。

实测数据
他们最近跟加州大学洛杉矶分校的塞缪利计算机科学系合作做了一项测试,结果显示Ferveret的APC方案比目前最先进的液冷方案,计算能效提升了15%。如果把这部分节省下来的电,再加上Ferveret的功率控制系统对运行条件的优化,同样多的电力,数据中心的AI模型能多产出35%的token。
Azizian第一次走进数据中心是2017年。他记得那时候整个建筑里全是巨大又嘈杂的冷却风扇。”我当时想,天哪,你们不是这么冷却设备的吧。”风冷最多能占到数据中心总功耗的40%。因为不影响性能,没人介意这套技术已经是50年前的了。
模块化设计,适配现有基础设施
Ferveret的产品做得比较巧妙,不是那种把服务器整个泡进去的大油箱,而是一个个能装单台服务器的小箱子,直接装在机架里。这样的模块化设计,部署和维护都方便,现有的数据中心基础设施不用大改。
他们还配套提供了控制软件,实时调整每台服务器的功率,进一步优化效率。Bucci说,他们的全栈系统包括冷却箱、机架、冷却分配单元和传感器,软件会监控这些传感器的数据,自动把每个箱子里的运行条件调到最优。
零耗水的地理红利
零耗水还有一个额外的好处。阳光充足的地方往往缺水,比如非洲、中东、美国的一些地区。Ferveret的技术让那些地方也有可能建数据中心,用当地的可再生能源,不用担心冷却用水的问题。
Ferveret现在已经跟几家公司展开了测试,包括数据中心开发商CleanSpark、AI加速器公司FuriosaAI,还有美国最大的数据中心运营商之一Switch。他们也在跟那些超大规模的云厂商谈,目前已经是英伟达Inception初创扶持计划的成员。公司计划今年晚些时候公布更多合作伙伴的消息。
