每次你向ChatGPT提问,你的请求都会触发一场数据接力赛。信息离开内存,经过CPU预处理,传输到GPU进行繁重计算,然后再返回——而AI生成的每一个字,整个流程都会重复一遍。
瓶颈是结构性的。这意味着每一个请求中,数据都要经过行业中一些最昂贵、功耗最高的芯片进行路由。这种低效正是XCENA试图解决的问题——这家在韩国和美国都设有办事处的初创公司,刚刚在B轮融资中筹集了1.35亿美元,估值达5.7亿美元。
“几十年来,CPU和GPU都变得更智能了。内存从来没有。XCENA想改变这一点。”——创始人Jin Kim
把计算搬进内存
XCENA的芯片MX1通过CXL(计算快速链接)连接到CPU——本质上是处理器和内存之间的专用快车道——在数据需要离开内存模块之前就对其进行处理。它是把计算带到数据附近,而不是反过来。
该公司声称,以前需要10台服务器完成的工作,现在可能只需要1台就可以完成。

为什么是内存,不是算力?
XCENA的业务押注于一个论点,即”推理不仅是计算问题;它越来越是一个内存扩展问题。”
虽然GPU擅长矩阵乘法——AI模型训练背后的繁重数学计算——但周围的许多数据编排,包括预处理、KV缓存管理(存储之前的对话上下文的系统,这样模型就不需要重新处理它)、数据缓存,仍然在CPU上运行。XCENA的芯片在内存模块本身内直接处理这些任务。
创始团队来自三星和SK海力士
XCENA首席执行官Jin Kim于2022年与首席技术官Dohun Kim、首席产品官Harry Juhyun Kim共同创立了这家初创公司,三人都来自三星和SK海力士——这两家内存巨头为英伟达的GPU提供芯片。
本月,主导全球内存芯片市场的三家公司——三星、SK海力士和美光——市值首次都超过了1万亿美元。XCENA押注的是,AI基础设施正朝着以内存为中心的架构更广泛地转变。
竞争对手和差异化
XCENA最接近的竞争对手包括Astera Labs和Marvell,这两家纳斯达克上市公司都在研发下一代内存连接技术。
差异化因素在于知识产权。XCENA有数千个核心,每个核心都基于RISC-V构建并专门针对数据处理进行了优化。相比之下,Marvell的方法依赖少数几个通用核心。
时间表和挑战
MX1目前仍然是原型。大规模生产的芯片预计将在2026年底从三星的代工生产线下线,该公司预计从2027年开始产生收入。
XCENA的理想客户是每年在AI基础设施上花费数百亿美元的超大规模企业,即使内存效率有微小的提升,也可能意味着数亿美元的节省。
- B轮融资1.35亿美元,估值5.7亿美元
- 累计融资总额达1.85亿美元
- MX1芯片基于RISC-V开源架构
- 目标客户:超大规模AI基础设施运营商
- 量产时间:2026年底;收入预期:2027年
