打破规模束缚！微软 Phi-4-reasoning 以 140 亿参数，跃升推理模型性能前列

5月03日

willai

微软推出 140 亿参数的开源推理模型 Phi-4-reasoning 。该模型基于约 140 万精心整理的推理示例进行监督微调（SFT），并经少量强化学习（RL）。虽规模不大，但在数学基准测试（如 AIME、HMMT、OmniMath 等）中，性能优于部分更大规模模型。它在推理能力上表现突出，通过 SFT 展现出推理技能的可迁移性，RL 进一步优化推理机制。

利好利空

0 条回复 A文章作者 M管理员

更换删除

暂无讨论，说说你的看法吧

❯

个人中心

购物车

优惠劵

今日签到

有新私信私信列表

搜索

幸运之星正在降临...

点击领取今天的签到奖励！

恭喜！您今天获得了{{mission.data.mission.credit}}积分

今日签到

连续签到

{{item.credit}}

连续{{item.count}}天

查看所有

我的优惠劵

_￥_优惠劵

使用时效：无法使用

使用时效：
之前

使用时效：永久有效

优惠劵ID：
×

限制以下商品使用：限制以下商品分类使用：不限制使用：

[{{ct.name}}]

所有商品和商品类型均可使用

没有优惠劵可用!

购物车

×

删除

购物车空空如也!

清空购物车前往结算

您有新的私信

没有新私信

写新私信查看全部

{{userData.name}}已认证

打破规模束缚！微软 Phi-4-reasoning 以 140 亿参数，跃升推理模型性能前列

Windows下部署Docker+Ollama+Dify步骤

Adobe全新Firefly平台引入OpenAI与Google的AI模型，创意工具再升级

在windows11非C盘安装Docker

DeepSeek+ragflow构建企业知识库：突然觉的dify不香了（1）

李彦宏谈DeepSeek现存痛点称Deepseek又慢又贵

Ollama非C盘安装

{{userData.name}}已认证

Windows下部署Docker+Ollama+Dify步骤

Adobe全新Firefly平台引入OpenAI与Google的AI模型，创意工具再升级

在windows11非C盘安装Docker

DeepSeek+ragflow构建企业知识库：突然觉的dify不香了（1）

李彦宏谈DeepSeek现存痛点 称Deepseek又慢又贵

Ollama非C盘安装

李彦宏谈DeepSeek现存痛点称Deepseek又慢又贵