### [两千亿参数、原生全模态,智象未来把图像大模型卷到了新维度](https://www.willai.cc/article/416) **Published:** 2026-05-21T07:11:00 **Author:** hiyoho **Excerpt:** 5月19日,智象未来在北京办了首届开放日,主题叫「Imagining the World」。会上最重磅的消息,是发布了参数超两千亿的图像大模型HiDream-O1-Image-Pro。 告别「拼接味」,原生全模态才是正路 现在市面上的图像生 5月19日,智象未来在北京办了首届开放日,主题叫「Imagining the World」。会上最重磅的消息,是发布了参数超两千亿的图像大模型HiDream-O1-Image-Pro。 ### 告别「拼接味」,原生全模态才是正路 现在市面上的图像生成模型,大多还是「拼接路线」——图像走一条路,文本走另一条路,最后拼在一起。这种做法在复杂语义理解、精准文字渲染上总是差点意思。 HiDream-O1-Image-Pro换了个思路:把图像像素、文本标记和任务条件统一放进一个连续共享的标记空间,从底层就开始「混着学」。这个架构叫Unified Transformer(UiT),智象未来管它叫「原生全模态」。 > 「当前很多『多模态大模型』,本质上还是『单模态拼接』。而原生多模态,是从一开始就把『世界的规则』刻进模型里——它知道物理定律、空间关系、因果逻辑,所以它能真正理解世界、推理世界,而不只是『生成内容』。」 > > —— 智象未来创始人兼CEO 梅涛 ![HiDream-O1-Image-Pro模型架构示意图](https://i.qbitai.com/wp-content/uploads/2026/05/%E6%99%BA%E8%B1%A1%E6%9C%AA%E6%9D%A5%E5%9B%BE%E7%89%871.png) HiDream-O1-Image-Pro架构示意图(图片来源:量子位) ### 开源版已经打遍榜上无敌手 其实在这之前,智象未来已经把8B参数的开源版本HiDream-O1-Image放到了全球评测平台Artificial Analysis上,结果在文生图开源模型里排到了全球第一,超过了Z-Image Turbo、Qwen-Image、FLUX.2这些主流对手。 这次发布的Pro版是闭源版本,参数直接干到了两千亿以上,在复杂文本渲染、指令编辑、多主体个性化这些任务上全面刷新了SOTA纪录。 ### 半月内连融两轮,资本用脚投票 开放日上还透露了一个信号:公司融资在提速。不久之前刚完成超5亿元融资,半月之内又敲定了新一轮,投资方包括深创投、金浦投资、财鑫资本、复聚资本等。 现在的阵容很有意思:安徽、上海、湖南、杭州的多方产业基金在跟,深创投、东方富海、峰华资本这些头部市场化VC也在押注。这个资本组合,摆明了是要在「原生全模态」这个方向上重仓。 ### 商业化落地:三个智能体产品已经跑起来 光有模型不够,智象未来同时亮出了三条产品线: - **HiBurst**:商业营销智能体,已覆盖TikTok、Meta、抖音、小红书等平台,是TikTok官方top5服务商,年生产电商营销视频超百万条 - **帧赞**:全球首个专业级AI影视创作智能体,已累计制作短漫剧超5000分钟 - **vivago**:社媒创作智能体,近日登上Product Hunt日榜第一,覆盖全球100多个国家超4000万用户 从视觉生成走向世界模型,这条路还长。但智象未来至少证明了一件事:原生全模态架构不是空中楼阁,它已经能打商业仗了。 * * * 📎 原文来源:[智象未来超两千亿参数图像大模型HiDream-O1-Image-Pro发布,融资持续提速 — 量子位](https://www.qbitai.com/2026/05/420753.html) **Tags:** AI, 图像生成, 大模型, 智象未来 **Categories:** AI资讯 ---