前几天刷到一条消息,阿里千问偷偷把Qwen3.7-Max放出来了。说实话,这次更新有点东西,不是那种换汤不换药的版本号游戏。

35小时、1000次工具调用,它真顶得住?
最让我意外的一个测试数据:Qwen3.7-Max在一次实验里连续跑了35个小时,调用了超过1000次外部工具,整个过程没有崩、没有逻辑断链、没有出现”我不理解你的请求”这类废话。
这是什么概念?你去问问任何一个用过AI辅助编程的朋友,大多数模型在复杂多步任务里,撑个两三个小时就开始”幻觉叠加”、前后矛盾、或者干脆装死。Qwen3.7-Max这个表现,说明它在长上下文推理和多轮工具调用这两个硬骨头上,确实啃下来了。
“全能智能体基座”——阿里的定位很明确,不是做一个只会聊天的模型,而是做一个能陪你把事情干完的底层引擎。
编程、办公、长任务,一个都不放过
Qwen3.7-Max现在的覆盖范围挺全的:
- 编程场景:从前端原型到复杂多文件工程,它都能接。这意味着你可以用它来重构代码库、跨文件修Bug、甚至帮你从零搭一个项目的骨架。
- 办公生产力:多智能体协作 + 工作流自动化。说白了,它不只是帮你写邮件,而是能理解你的业务流程,然后自己跑去调用各种工具把活干完。
- 长周期任务:这才是真正的门槛。35小时不间断,意味着它可以陪你跑完一个完整的软件发布周期,或者帮你盯一个持续集成流水线的全部过程。
已经在阿里云上百炼上线,还能跑在Claude Code上
有一点挺关键的:Qwen3.7-Max不是只给千问App用户玩的,它已经接进了阿里云百炼平台,开发者可以直接调用API。
更值得注意的是,它宣称支持跨框架泛化——能在Claude Code、OpenClaw、Qwen Code等多个开发框架里稳定运行。这话听着有点狂,但如果真的能做到,那意味着阿里的模型在”兼容性”这件事上,开始认真跟Anthropic和OpenAI掰手腕了。
用户现在可以把千问App更新到6.9.7以上版本,在应用里直接切换到Qwen3.7-Max。PC端和网页端也同步开放了。
国产大模型,这次真的在拼”实用”了
回过头看,2026年这几个月,国产大模型的节奏明显变了。以前大家比的是”我有多少参数””我在哪个榜单上刷了第一”,现在比的更多是:你的模型到底能不能帮用户把活干完?
Qwen3.7-Max打的就是这个痛点。35小时工具调用不掉链子,这件事本身就是一个很强的信号:长周期Agentic任务,不再只是PPT上的概念,而是有模型真的在往这个方向死磕。
至于它能不能真的在实际生产环境里顶住,还得看接下来几个月开发者的反馈。但至少从目前已经放出来的信息看,阿里千问这一步,走得不虚。
