暂无菜单项

OpenAI终于亮出底牌:自研芯片Jalapeño登场,英伟达要紧张了

发布于
1
OpenAI Jalapeño AI芯片概念图
OpenAI与博通联合推出的Jalapeño推理芯片概念图(图片:AI生成)

6月24日,OpenAI干了一件酝酿很久的事——和博通(Broadcom)联合发布了第一款自研芯片,名字叫Jalapeño。这块芯片专门给推理(inference)用的,就是跑已经训练好的模型、响应玩家指令那个环节。

OpenAI的总裁Greg Brockman之前在自家播客里聊过他们的思路:”我们对自己干的活儿心里有数。一直在找那些没被伺候好的工作负载,琢磨怎么造点东西把可能性往前推一步。”这话听着谦虚,但其实野心不小。

为什么是推理芯片?

这块Jalapeño芯片目前还在测试阶段,但OpenAI说早期结果显示,性能和功耗比(performance-per-watt)比现有顶级方案强不少。推理环节的能耗成本一直是AI公司的心头大患——每次你问ChatGPT一个问题,背后都是真金白银在烧。能把这块成本压下来,对OpenAI的盈亏底线意义巨大。

OpenAI在公告里特意提了实时编程模型跑在Jalapeño上的低成本表现。这明显是在为Codex这类agent产品铺路。

这事背后的大背景是OpenAI想减少对英伟达GPU的依赖。其实谷歌和亚马逊早就走在前面了——谷歌有TPU,亚马逊有Trainium,都是类似的”AI加速器”,专门给机器学习任务提速的硅片。OpenAI这步棋,算是补上了自己在整个技术栈里最后一块拼图。

AI帮忙设计芯片,这事儿有点意思

有意思的是,OpenAI自己的AI模型也参与了这块芯片的设计过程。换句话说,AI帮忙设计了跑AI的芯片,这事儿本身就挺有意思的。

这块芯片定位很明确:主攻推理,不碰训练。像预训练那种吃算力最狠的活儿,短期内还得靠英伟达的硬件。但推理是每天每刻都在发生的——每个人问ChatGPT一个问题,就是一次推理。积少成多,这块的成本哪怕是小幅下降,乘以几十亿次查询,省下来的钱都是天文数字。


从芯片到产品,全栈通吃

OpenAI在公告里写了一句挺有分量的话:”OpenAI不只是在开发前沿模型,或者在模型上面搭产品,我们是在设计底层基础设施:芯片架构、内核、内存系统、网络、调度、部署系统,还有产品体验。”

因为OpenAI横跨整个技术栈的每一层,都可以围着同一个目标来优化:让模型更快、更可靠、对用户更便宜。这话翻成白话就是——能自己掌控的,就不让别人卡脖子。

按照计划,Jalapeño会在2026年底之前部署到微软和其他合作伙伴的数据中心里。这事如果顺利,OpenAI在整个AI基础设施链条上的话语权会比现在大得多。英伟达估计得留意了——虽然是合作伙伴,但OpenAI显然不想永远被别人的供应链卡脖子。

0 点赞
0 收藏
分享
0 讨论
反馈
0 讨论
热门最新
总结
暂无总结
0 / 600