暂无菜单项

这家AI公司说自己的世界模型能模拟真实驾驶,但跑着跑着纽约就消失了

发布于
2

AI初创公司Decart本周发布了Oasis 3,一个声称能实时生成照片级真实驾驶环境的世界模型。TechCrunch提前拿到了独家信息,我仔细读完了整篇报道,感觉这个故事比标题看起来复杂得多。

世界模型到底是什么

先解释一下背景。所谓”世界模型”,简单说就是AI学会了对物理世界的运行规律建模,给它一个文本提示,它能生成一个你可以交互的虚拟环境。这东西在自动驾驶仿真、机器人训练这些领域有很大价值——你可以用它低成本地生成各种罕见的驾驶场景,不用真的去马路上冒险。

Decart的Oasis 3主打的就是这个方向。他们声称这个模型能生成物理准确、多摄像头(一个前置加两个侧置)的驾驶环境,而且可以无限生成场景。目前通过API对外提供,定价是每秒0.02美元。

Decart Oasis 3 世界模型演示
Decart Oasis 3 生成的照片级真实驾驶场景丨来源:TechCrunch

理想很丰满,现实有点骨感

TechCrunch的记者亲自测试了Oasis 3,结果发现的问题还不少。最明显的一个:你让模型生成一个”早晨的纽约市街道”,它确实能跑出来,看起来挺像那么回事。但你往前开个一阵子,周围的场景就开始走样了,越来越不像纽约,最后变成了”任何一个西方城市的普通版本”。

当你试图掉头回到最开始的那个路口时,你会发现它已经消失了,取而代之的是一个全新的环境。整个体验不像一个连贯的模拟,更像是一个梦幻般的、脱节的意识流。

还有一个更基础的问题:物理一致性。在Oasis 3生成的世界里,汽车会直接穿过其他汽车,就像幽灵一样。Decart的CEO Dean Leitersdorf承认这是一个”正在破解的重大研究问题”,原因是”关于良好驾驶的数据远远多于事故数据”——模型没见过足够的事故场景,所以学不会避让。

为什么效率这么高

尽管有上述问题,Decart在技术效率上确实有两把刷子。他们的DOS(Decart优化栈)软件能让模型在英伟达、亚马逊和谷歌的硬件上高效运行,声称运行成本比竞争对手低一个数量级以上。

Leitersdorf甚至说,公司整个生命周期的烧钱额”远低于”1亿美元。考虑到他们刚刚完成3亿美元融资、估值接近40亿美元,投资方里还有丰田、Adobe、eBay和英伟达,这个烧钱速度在今天的AI初创圈里确实算克的。


拥挤的赛道

世界模型这个方向现在挤得不行。谷歌今年1月发布了Genie 3的研究预览版,李飞飞的World Labs推出了商用产品Marble,Luma和Runway这些视频生成公司也在把他们的技术往世界模型方向转。Decart的差异化策略是:从第一天就开放API,让开发者在上面构建应用——这个玩法确实有点像OpenAI当年对LLM做的事。

目前Decart已经积累了超过10万名开发者的社区,很多人用他们的实时视频模型Lucy在做电子商务和直播相关的产品。Oasis 3发布之后,这个社区规模大概率还会涨。

至于世界模型什么时候能真正可靠到可以替代真实路测,现在还没人能给出确切答案。Decart说下一个版本会允许用户基于视频(而不是图片)来生成世界,这可能会改善一致性问题。但从根本上说,这个世界模型还是一个自回归系统——一次生成一帧,然后看之前生成了什么来决定下一帧,这个架构本身就很吃算力,要保持长时间的一致性非常难。

0 点赞
0 收藏
分享
0 讨论
反馈
0 讨论
热门最新
总结
暂无总结
0 / 600
嗨,下午好!
所有的成功,都源自一个勇敢的开始
聊天室

登录后参与聊天