暂无菜单项

阿里Qwen 3.7-Max来了:国产大模型首次冲进全球前15

发布于
2

5月20日,阿里云峰会上,阿里巴巴正式发布了千问新一代旗舰模型Qwen 3.7-Max。这次不是简单的版本号迭代,而是在全球AI模型排行榜上,中国模型第一次稳定地站到了第一梯队。

Arena排名#13,数学能力全球第7

先说成绩。Qwen 3.7-Max-Preview在Arena(前大模型竞技场)的全球综合排名是第13位,数学领域排到第7,代码领域第10。这个成绩让它成了当时排名最高的中国闭源模型。

阿里巴巴的实验室排名也因此拉升到了全球第6。这个意义不只是数字好看——它意味着国产大模型在通用能力上,已经逐步逼近海外头部厂商。

Qwen 3.7-Max支持100万token上下文,开启扩展思考模式后,可以连续自主运行35小时、调用超过1000次工具而性能不衰减。

闭源旗舰+开源次旗舰的双轨策略

阿里这次继续沿用”开源次旗舰+闭源旗舰”的商业化路线。Qwen 3.7分为两个版本:

  • Qwen 3.7 Plus:开源,面向开发者,适合本地推理场景
  • Qwen 3.7 Max:闭源,付费使用,面向企业级高要求商用场景

这个策略很聪明。开源版本维持社区影响力,闭源旗舰版探索商业化变现。对国内其他AI厂商来说,这也是一条可以参考的落地路径。

实际用起来怎么样

从实测来看,Qwen 3.7-Max有几个比较明显的特点:

代码生成偏简洁。在保障功能正确性的前提下,能用更少代码实现相同功能,适合生产环境维护。逻辑严谨性也优于同梯队模型。

数学能力是真的强。处理高阶数学问题时,准确率明显高于同梯队其他模型,支持多模算术交叉验证,符合它数学能力全球第7的排名。

文化适配性好。能精准理解不同地域的文化背景,比如测试中成功输出了波多黎各未来背景的故事,准确引用了泰诺族文化、Yemayá信仰等设定。


定价和可用性

预览阶段还没有公布官方API定价。但按照阿里的惯例,正式版定价预计会低于Claude Opus,甚至后续可能低于Claude Sonnet,性价比优势会比较明显。

目前Qwen 3.7-Max-Preview已经在Qwen Chat和Arena AI上线,正式版预计近期就会全面开放API访问。

0 点赞
0 收藏
分享
0 讨论
反馈
0 讨论
热门最新
总结
暂无总结
0 / 600