这家芯片初创把计算搬进内存，1.35亿美元融资到手

发布于 2天前

每次你向ChatGPT提问，你的请求都会触发一场数据接力赛。信息离开内存，经过CPU预处理，传输到GPU进行繁重计算，然后再返回——而AI生成的每一个字，整个流程都会重复一遍。

瓶颈是结构性的。这意味着每一个请求中，数据都要经过行业中一些最昂贵、功耗最高的芯片进行路由。这种低效正是XCENA试图解决的问题——这家在韩国和美国都设有办事处的初创公司，刚刚在B轮融资中筹集了1.35亿美元，估值达5.7亿美元。

“几十年来，CPU和GPU都变得更智能了。内存从来没有。XCENA想改变这一点。”——创始人Jin Kim

XCENA的芯片MX1通过CXL（计算快速链接）连接到CPU——本质上是处理器和内存之间的专用快车道——在数据需要离开内存模块之前就对其进行处理。它是把计算带到数据附近，而不是反过来。

该公司声称，以前需要10台服务器完成的工作，现在可能只需要1台就可以完成。

XCENA的业务押注于一个论点，即”推理不仅是计算问题；它越来越是一个内存扩展问题。”

虽然GPU擅长矩阵乘法——AI模型训练背后的繁重数学计算——但周围的许多数据编排，包括预处理、KV缓存管理（存储之前的对话上下文的系统，这样模型就不需要重新处理它）、数据缓存，仍然在CPU上运行。XCENA的芯片在内存模块本身内直接处理这些任务。

XCENA首席执行官Jin Kim于2022年与首席技术官Dohun Kim、首席产品官Harry Juhyun Kim共同创立了这家初创公司，三人都来自三星和SK海力士——这两家内存巨头为英伟达的GPU提供芯片。

本月，主导全球内存芯片市场的三家公司——三星、SK海力士和美光——市值首次都超过了1万亿美元。XCENA押注的是，AI基础设施正朝着以内存为中心的架构更广泛地转变。

XCENA最接近的竞争对手包括Astera Labs和Marvell，这两家纳斯达克上市公司都在研发下一代内存连接技术。

差异化因素在于知识产权。XCENA有数千个核心，每个核心都基于RISC-V构建并专门针对数据处理进行了优化。相比之下，Marvell的方法依赖少数几个通用核心。

MX1目前仍然是原型。大规模生产的芯片预计将在2026年底从三星的代工生产线下线，该公司预计从2027年开始产生收入。

XCENA的理想客户是每年在AI基础设施上花费数百亿美元的超大规模企业，即使内存效率有微小的提升，也可能意味着数亿美元的节省。

街头艺术风人物肖像与趣味夸张漫画