这家AI公司说自己的世界模型能模拟真实驾驶，但跑着跑着纽约就消失了

发布于 5小时前

AI初创公司Decart本周发布了Oasis 3，一个声称能实时生成照片级真实驾驶环境的世界模型。TechCrunch提前拿到了独家信息，我仔细读完了整篇报道，感觉这个故事比标题看起来复杂得多。

世界模型到底是什么

先解释一下背景。所谓”世界模型”，简单说就是AI学会了对物理世界的运行规律建模，给它一个文本提示，它能生成一个你可以交互的虚拟环境。这东西在自动驾驶仿真、机器人训练这些领域有很大价值——你可以用它低成本地生成各种罕见的驾驶场景，不用真的去马路上冒险。

Decart的Oasis 3主打的就是这个方向。他们声称这个模型能生成物理准确、多摄像头（一个前置加两个侧置）的驾驶环境，而且可以无限生成场景。目前通过API对外提供，定价是每秒0.02美元。

Decart Oasis 3 世界模型演示 — Decart Oasis 3 生成的照片级真实驾驶场景丨来源：TechCrunch

理想很丰满，现实有点骨感

TechCrunch的记者亲自测试了Oasis 3，结果发现的问题还不少。最明显的一个：你让模型生成一个”早晨的纽约市街道”，它确实能跑出来，看起来挺像那么回事。但你往前开个一阵子，周围的场景就开始走样了，越来越不像纽约，最后变成了”任何一个西方城市的普通版本”。

当你试图掉头回到最开始的那个路口时，你会发现它已经消失了，取而代之的是一个全新的环境。整个体验不像一个连贯的模拟，更像是一个梦幻般的、脱节的意识流。

还有一个更基础的问题：物理一致性。在Oasis 3生成的世界里，汽车会直接穿过其他汽车，就像幽灵一样。Decart的CEO Dean Leitersdorf承认这是一个”正在破解的重大研究问题”，原因是”关于良好驾驶的数据远远多于事故数据”——模型没见过足够的事故场景，所以学不会避让。

为什么效率这么高

尽管有上述问题，Decart在技术效率上确实有两把刷子。他们的DOS（Decart优化栈）软件能让模型在英伟达、亚马逊和谷歌的硬件上高效运行，声称运行成本比竞争对手低一个数量级以上。

Leitersdorf甚至说，公司整个生命周期的烧钱额”远低于”1亿美元。考虑到他们刚刚完成3亿美元融资、估值接近40亿美元，投资方里还有丰田、Adobe、eBay和英伟达，这个烧钱速度在今天的AI初创圈里确实算克的。

拥挤的赛道

世界模型这个方向现在挤得不行。谷歌今年1月发布了Genie 3的研究预览版，李飞飞的World Labs推出了商用产品Marble，Luma和Runway这些视频生成公司也在把他们的技术往世界模型方向转。Decart的差异化策略是：从第一天就开放API，让开发者在上面构建应用——这个玩法确实有点像OpenAI当年对LLM做的事。

目前Decart已经积累了超过10万名开发者的社区，很多人用他们的实时视频模型Lucy在做电子商务和直播相关的产品。Oasis 3发布之后，这个社区规模大概率还会涨。

至于世界模型什么时候能真正可靠到可以替代真实路测，现在还没人能给出确切答案。Decart说下一个版本会允许用户基于视频（而不是图片）来生成世界，这可能会改善一致性问题。但从根本上说，这个世界模型还是一个自回归系统——一次生成一帧，然后看之前生成了什么来决定下一帧，这个架构本身就很吃算力，要保持长时间的一致性非常难。

📎 原文来源：Decart’s new world model can simulate hours of photorealistic driving — with some caveats | TechCrunch

这家AI公司说自己的世界模型能模拟真实驾驶，但跑着跑着纽约就消失了

世界模型到底是什么

理想很丰满，现实有点骨感

为什么效率这么高

拥挤的赛道

谷歌AI把Google拼错了，大语言模型的拼写死穴到底能不能修好

Tabby：32K Stars！开源自托管AI编程助手，让代码补全完全私有化

谷歌给安卓加了道通话防火墙：AI深度伪造的诈骗电话，现在能自动识别了

Erin Brockovich当年告倒了电力公司，现在她盯上了数据中心的黑箱操作

awesome-mcp-servers：88.1K Stars！MCP生态全景图，AI连接万物的导航地图

这家芯片初创把计算搬进内存，1.35亿美元融资到手

Qdrant：31.6K Stars！高性能向量数据库，让AI语义检索快如闪电

AI 代理正在重塑互联网基础设施，AWS、微软、Cloudflare 纷纷入局