在刚刚过去的Build 2026开发者大会上,微软做了一个不太高调、但信号很明确的动作:发布了自研推理模型MAI-Thinking-1。这是微软AI部门第一个真正意义上的”高级推理模型”,350亿活跃参数,从零开始用干净数据训练,没有走蒸馏第三方前沿模型的捷径。
这个名字里的”MAI”,指的是Microsoft AI。简单来说,微软想把AI能力握回自己手里,不再只是OpenAI的一个渠道商。
跟OpenAI的”婚姻”变了:不再是独家绑定
就在MAI-Thinking-1发布的几乎同一时间,微软和OpenAI悄咪咪把合作协议改了。新协议里,微软对OpenAI模型的授权有效期延长到2032年,但最关键的变化是:独家权没了。OpenAI可以去找别的云服务商合作,微软也可以自己搞AI系统,双方都留了后路。
微软不是要跟OpenAI分手,而是不想再把所有鸡蛋放在一个篮子里。自研模型是保险,也是筹码。
这个变化背后有个很现实的原因:依赖单一供应商是有风险的。如果OpenAI的模型出问题、涨价、或者路线调整跟微软的产品规划不合拍,微软需要一个备选方案。
MAI-Thinking-1到底能干嘛?
根据微软公布的信息,MAI-Thinking-1主打的是”推理”能力——不是简单地接一句话、回一句话,而是能处理多步指令、长上下文推理、软件工程任务、代码生成、数学问题等需要”想一想”的场景。
- 350亿活跃参数,规模中等但效率高,token使用成本低
- 支持引入用户自有数据来提升推理准确率
- 目前通过Microsoft Foundry平台开放私有预览,开发者可以申请测试
- 未来将逐步集成到Copilot、GitHub、Microsoft 365、Azure等核心产品
不只是推理模型:微软一口气发了整个MAI系列
跟MAI-Thinking-1一起亮相的,还有一整套MAI模型家族,覆盖了代码、图像、语音、转录等多个方向:
- MAI-Code-1-Flash:推理效率极高的编程模型,已经集成到GitHub Copilot和VS Code,适配”用一句话生成应用”的开发场景
- MAI-Image 2.5:支持文生图和图像编辑
- MAI-Transcribe-1.5:语音转文字,速度比同类竞品快5倍
- MAI-Voice-2:合成语音,新增15种语言和更多音色
更有意思的是,微软还推了几个可以直接跑在Windows PC上的小型Aion模型,不需要联网就能做本地AI推理。配套的硬件产品也在路上:跟英伟达合作的Surface RTX Spark Dev Box,是一个面向开发者的本地AI开发设备,用来做原型开发、微调和测试,重负载再迁到云端。
微软的算盘是:自研模型针对自己的产品和硬件做优化,跑在Azure上,成本比买第三方的便宜。开发者用起来更便宜,微软的利润率也更高。
AI从”工具”升级为”操作层”
MAI-Thinking-1的发布,折射出微软对AI的一个更大胆的设想:AI不应该只是一个聊天窗口,而应该成为工作场景的”操作层”——能跨Microsoft 365、Windows、GitHub这些系统执行任务,而不只是回答问题。
微软把这个设想包装成了一个产品方向,叫”Scout”——一个能跨应用协作的AI智能体。如果这个方向走通了,AI在微软生态里的角色,将从”帮你写邮件的助手”升级为”帮你把整件事干完的同事”。
当然,这一切目前还在早期。MAI-Thinking-1还在私有预览阶段,普通用户暂时用不上。但信号已经很清楚了:微软不想永远活在OpenAI的影子里,它要自己的AI能力,而且要能跟OpenAI的模型正面竞争。
