V0创始人:从设计图到代码,AI绝对能搞定。翻译类的代码任务,都应该交给AI去干。

AI 大佬 Andrej Karpathy 提出的 Vibe Coding,最近特别火,这是一种全新的编程理念,强调 “写代码像聊天一样自然”。

AI 大佬 Andrej Karpathy 提出的 Vibe Coding,最近特别火,这是一种全新的编程理念,强调 “写代码像聊天一样自然”。

开发人员不再需要从零写代码,用自然语言描述功能或界面,AI 就能理解意图并自动生成代码。V0 正是这一理念的实践,它让从设计到开发的过程更高效,只需一句提示或一张设计图,就能生成高质量的 React 代码,大幅降低前端开发门槛。

V0创始人:从设计图到代码,AI绝对能搞定。翻译类的代码任务,都应该交给AI去干。

V0 是由 Vercel Labs 开发的,最近,他们创始人兼 CEO Guillermo Rauch 做了一期播客。他在播客中深入探讨了 AI 时代产品开发会发生什么变化,解释了为什么未来开发应用将更多依赖提示而非代码,以及我们现在应重点培养哪些关键技能。

我们团队对播客内容进行了精编翻译。

我先摘了一些有趣的内容:

  • 很多过去属于 “专业技能” 的编程任务,正在慢慢消失,它们变成了 “翻译” 任务。

  • 大模型是在与现有的世界协作,而不是从无到有。所以那些掌握 “底层基础设施构建能力” 的工程师,在未来仍然会极具竞争力。

  • 我完全相信专家级 AI 工具才是未来。

  • 我们迟早会停止谈论 “AI”。虽然我知道这可能不太现实,但我仍然觉得有必要提醒大家:AI 即软件。

  • 能把你做的东西展示出来、分享出去,这是未来非常关键的技能。我看到的最棒的一些 V0 应用,根本不是技术团队做出来的,而是市场团队、销售团队、产品团队做的!AI 构建应用时代有三项核心技能:知道 “该构建什么”,让它 “看起来好看”,让项目 “有序推进”。一个优秀的产品,是由无数个细节组成的。你永远做不完它。

下面是译文。

#01

V0 的诞生与愿景

主持人:今天我的嘉宾是 Guillermo Rauch。他是 Vercel 创始人兼 CEO,Vercel 推出了一款叫 V0 的产品,现在已经成为全球最受欢迎的 AI 建站工具之一。

他本身也是一位传奇工程师和开源贡献者,创建过一些全球最流行的 JavaScript 框架,比如 Next.js 和 Socket.IO。他既是一个 “创造者”,也在打造一款将会改变我们未来构建产品方式的工具。

如果你想真正了解 AI 崛起之后,产品开发会发生怎样的变化,以及你现在应该重点培养哪些技能,我强烈建议你听下去。现在让我们欢迎 Guillermo Rauch。

Guillermo Rauch:是的,在某种意义上说,这其实也是我这十年来,甚至可以说是我一生都在做的事,因为我作为开发者的优势,其实有点 “元开发” 的意味——我擅长的是创造开发工具。

我做过很多受欢迎的开源框架,Next.js 是其中一个。但在那之前,在我职业生涯的早期,我还做过另一个工具,叫 Socket.IO,这是一种实时通信机制。比如说你用 Notion 时,我记得你也采访过 Notion 的 Ivan,当 Notion 需要将信息实时广播给协作者时,他们所使用的实时引擎就是我为 Socket.IO 构建的系统。

因此,为什么很多创业公司和企业愿意使用我开发的产品?是因为它们让一些原本很难实现、但非常有吸引力的功能变得简单了。过去是实时应用,现在则是通过 Next.js 构建前沿的 Web 应用。我尽量把这些过程变得简单——尽管你还是需要具备一定的开发技能。

现在的机会在于:假设全球有 500 万 React 开发者(这是我们使用的库引擎),JavaScript 开发者大概有 2000 万,那有多少人想要构建产品,或者有产品构建愿望的人呢?

我随手算过一个最低估值,大概是 1 亿人。我是怎么得出这个数字的?Slack 的月活跃用户大概就是 1 亿左右。在 Slack 里,你会看到人们在里面聊天,其中很多人其实都在构建数字产品——他们讨论他们想在这个世界上看到什么,或者通过共享频道和客户对话。

我很喜欢这个场景。

我们也和很多 Vercel 的客户聊过,他们会告诉我们:“我想做这个功能”、“我想看到那个东西”、“我想要这个设计”、“我希望有那个能力”。

所以,V0 的机会点在于,它并不是让你停止和他人交流,而是——如果你能直接对着电脑说话,然后马上就能看到结果,比如构建一个原型、一个产品的初版、一个 Demo、一个完整的全栈应用,并且能上线——那将会多么强大。

所以这个灵感其实是非常契合 Vercel 的使命的。而它最初的起点,其实是在 ChatGPT 出现的时候,我们注意到它很擅长编写我们的工具所使用的代码。

换句话说,从一开始,ChatGPT 就已经很擅长写 JavaScript,擅长 Tailwind(CSS 样式工具),擅长 Next.js。而这背后的关键,其实是开源的力量——我们的工具已经成为了互联网训练数据的一部分。多年来对开源的投入和愿景,如今得到了回报。

也正因为这些模型在这类代码生成上表现这么好,所以 V0 的想法自然地就出现了:我们能不能造一个 “用于构建 Web 产品的 ChatGPT”?

主持人:说到这个,我其实之前并不知道。我采访 Bolt 的 CEO 时,他提到 Claude 解锁了他们的业务能力。那你们这边,是主要跑在 ChatGPT 和 OpenAI 上吗?

Guillermo Rauch:我们最初是从 OpenAI 开始的,而且我们一直使用的是多个模型的组合。现在你在 Twitter 上可以看到很多人试图反向推理我们用的提示词和模型,有些视频的播放量甚至过百万。

主持人:Reddit 上也有不少人研究这个。

Guillermo Rauch:对,他们发现其实有很多不同的模型在各自擅长的任务中发挥作用,它们会组成一个模型流程,彼此交接任务。所以我们用过 OpenAI、Gemini、Claude。

我们其实比 Anthropic(Claude 的公司)更早开始探索这些方向。我必须承认,是 ChatGPT 的泛用性给了我们极大的启发。甚至可以说,V0 的第一个原型可能还早于 ChatGPT 的正式发布,至少是在 GPT-3.5 上运行的。

所以我们从一开始就抱着一个愿景——借助大语言模型,为 Web 世界释放出更强的力量。

而且语言模型恰好在 Web 设计和开发这类任务中特别擅长,其中还有很多非常有趣的技术细节可以深挖。对我们来说,一切都刚刚好。

主持人:这个我待会儿还想再问。但我们先来聊聊 V0 的规模吧。我们现在听到行业里各种各样的数据,那你能分享一下 V0 到目前为止的使用情况吗?

Guillermo Rauch:我可以告诉你,它现在处于指数级增长状态,已经有超过 130 万用户与 V0 互动过。就在昨天,我们创下了历史最高单日使用量。今天又是历史新高。目前,我们已经成为几乎所有云服务提供商中最大的客户之一。可以说,我们正在逼近全球每一家 GPU 和大语言模型基础设施的使用极限。

而让我最兴奋的事情,是看到人们用 V0 构建的各种东西。我们大约一个月前上线了一个叫 “V0 社区” 的功能,甚至可能还不到一个月,现在已经有两万个提交。

你可能用过 Figma,我特别喜欢 Figma 的一点是,它有很多现成的文件,比如 logo、菜单等等,你可以直接拿来作为起点。

在 V0 社区中,我们也有这种开放共享的精神,有点像开源的方式。在不到一个月的时间里,我们收到了超过两万个社区贡献,我们从中学到了很多关于构建 AI 产品的经验,也持续在开源和分享我们的最佳实践。

不过我也学到了一件事——“提示词输入” 这个界面看起来简单,因为它就是个输入框,但其实人们有时候会遇到写作卡壳的情况。所以我最喜欢的一个社区场景就是:你现在去 V0 的首页,可以看到一堆随机的社区提交,有的被分叉了 100 次,有的被分叉了 1500 次,甚至 6000 次。

每一次分叉,都是有人说:“我不想从零开始做,我就从这个别人做的应用开始,然后用提示词修改一下,变成我自己的。”

主持人:所以这些社区提交,其实是用户在 V0 上做的应用,然后把它们分享出来,别人可以查看源码,也可以分叉使用?

Guillermo Rauch:对,而且这变成了一个复利效应的投资过程。一个人分享了一个项目,另一个人接着优化它,或许你也会用上它。某种意义上讲,我认为这像是 GitHub 的下一阶段进化。

GitHub 是软件开发的奇迹,它实现了“社交编程”(你可能还记得 GitHub 当年 Logo 下方的口号),带来了软件开发的民主化。但你还是得会写代码。而我们现在追求的,是“社交化的产品构建”。我们希望,每一个人都能参与构建、共享自己做的产品。

主持人:我很喜欢你这样理解这件事。这让我更能感受到你对开源的热爱——在 V0 上,大家可以构建并分享,然后别人再在此基础上继续构建。这种体验就像是开源的 AI 产品构建平台。

Guillermo Rauch:确实很有意思。你想想看,git commit 本身其实是个非常有意思的动作。如果你观察一个工程师怎么工作,他会先研究问题,在代码编辑器里折腾半天,最后终于说:“我搞定了。” 然后他提交一个 git commit,总结他的意图和完成的工作。这是一个 “先干活,再总结” 的流程。

但在 V0 里,这个过程被彻底颠倒了——你一开始就去和 AI 说:“请把这个按钮的颜色改一改,点击后把表单内容保存到数据库。”你从 “意图” 开始,而代码是结果,作为副产品我们甚至还能为你生成一个 git commit。

这个功能现在还没上线,但会在未来几天内推出。算是提前剧透一下。

我喜欢这个理念:我们可以用这个平台,把所有构建软件的方式整合在一起,变成一个通用的统一工具。

这其实也呼应了我当初创办 Vercel 的初衷。我们的使命是 “让全世界都能构建和发布最棒的产品”,而现在我们正让更多人具备这个能力。对我来说,这是最令人激动的事情。

#02

人人都能做产品

主持人:我们来正面谈谈一个大家心里都有疑问、但一直没说出口的问题:很多产品从业者过去一直用某种方式在构建产品,但现在这些工具出现了——你只要输入一句话,它就能帮你把东西做出来,还做得很漂亮。你觉得产品经理、产品团队将会迎来怎样的变化?你觉得最大的变化会发生在哪里?未来几年里,产品会以什么方式被构建?

Guillermo Rauch:我觉得最深刻的一个变化,其实我刚才已经稍微提到过了,那就是:未来产品构建者与客户之间的对话,会被类似 “V0 链接” 这样的产物所中介。

我觉得 Claude 给这些叫 “Artifacts”(人工制品)这个名字,真的非常妙。我们这些人,尤其是这个圈子里的人,来到这个世界就是为了打造很棒的东西,并把它们分享出去。Steve Jobs 曾经在一次演讲里说过:我们回馈世界的方式,就是尽可能地把事情做到最好,然后拿出来与全世界分享。

所以,如果我们在讨论一个想法时,却没有把它变为现实的能力——那对我来说就是一种损失。我希望人们可以始终处于产品之中,沉浸在设计里,反复调整、实验新的想法。我理想中的未来工作方式就是这样,而不是那种抽象、疏离的状态。

有时候,当公司内部多个部门协作时,你会发现很多人其实对产品是 “无能为力” 的。比如市场部希望设计部做一些改动,市场部也希望工程师去实现一些功能,而工程师又要依赖设计部……这种协作总是受限的,对吧?

我们在 Vercel 的博客上发过一篇关于 “设计工程” 的文章,引发了大家很大兴趣。因为我们发现,在 Vercel 上用得最成功的一些人,其实是同时具备设计和工程能力的。这也是我们当初做 V0 的一个重要启发:我们意识到人们是可以变得更“全能”的。

我们不应该设限,不该设限自己能构建什么、能发布什么,也不该设限我们可以梦想哪些 Web 体验变成现实。

想象一下,如果这些限制都被消除了——设计师可以发布一个完整可用的产品;产品经理可以从原型直接上线;而很多用 V0 的人其实是后端工程师,他们过去只能做 API 或基础架构,但现在他们终于可以把自己的完整产品愿景实现出来了,因为我们为他们 “补全了最后一公里”

#03

理解基本运作方式依然很重要

主持人:那我就接着工程师这个话题问了——很多人都在想,以后还需要工程师吗?工程师的未来会怎样?我到底还要不要学写代码?你自己是个长期做工程的人,你会怎么建议那些正在思考职业方向的人?

Guillermo Rauch:我认为,理解事物的工作原理,是这个世界上最重要的技能。

我预见,会有越来越多的人在构建和发布产品这件事上表现得极其出色,他们可以一个人做 100 个专业岗位的工作,甚至能构建出一家巨大的公司,涵盖你能想象的一切。

举个例子,要构建一个前端产品,其中一个关键技能是——你得会用 CSS 或 Tailwind 来做样式。从前,我会专门雇一些人,他们在这方面就是专家。他们的工作是把 Figma 或设计稿 “翻译” 为现实界面,因为他们非常熟练地掌握了布局、盒模型、边框、间距、Flexbox 等等这些技术。

你有没有发现我用了 “翻译” 这个词?我是特意这样说的。因为大语言模型的起源,或者说 Transformer 架构的起点,其实就可以追溯到谷歌翻译这类系统。它们本质上就是生成式语言模型技术。所以你可以理解为什么 “翻译” 这个问题,后来突然之间就被 AI 解掉了。

我认为,现在很多 “程序员的任务”,其实也都是 “翻译” 任务。你从截图、想法、设计稿,翻译成 React 和 Tailwind 的代码。而目前 V0 在这方面的表现,已经非常非常优秀。

它现在已经强大到什么程度呢?我每次发布一个新版本的模型时,都会亲自做测试:试着用 V0 把我自己的网站重建一遍。

上一次测试时,我大概用了十个提示词就把它搭出来了。要知道,我可是一个前端专家,从十岁就开始写前端,现在已经三十五岁了。我做这个测试,其实也是一种 “自我谦逊测试” 吧——因为我还记得当初是怎么用我自己创建的 Next.js 框架,从零把网站一步步做出来的,那花了不少时间。

而用最新一代的模型,我只用了两个提示词。

从 “设计意图” 到 “工作代码” 的这个翻译过程,现在几乎是无缝的。我给你举个例子——V0 会内嵌我们对 Web 最佳实践的理解。它生成的代码,比我自己写的还符合无障碍标准(accessibility guidelines),也比我更好地遵守了 W3C 的网页标准。

因为它真的 “什么都知道”。

所以,那些你可以 “建模为翻译任务” 的工作,确实正在消失。但这也进一步说明:你理解底层原理的能力,仍然非常关键。

注意我这整场谈话中不断使用一些 “特定术语”——比如 CSS、布局、样式属性。这些术语就像一种“符号系统”。你能不能理解这些术语,将决定你是否能引导模型更准确地执行你的意图。

所以说得直白点:你必须知道系统是怎么运作的,理解这些符号系统。你可能不再需要深入掌握每个领域的全部细节,但你必须知道它们的基本原理。

我在 Vercel 有一些工程师,他们能把每一个 CSS 属性倒背如流,甚至知道哪个属性是什么时候在某个浏览器里被引入的。他们把 CSS 规范研究得比什么都透彻。

但在未来,你可能不再需要掌握得这么深。这样反而能把大脑空间腾出来,去想更宏大的事情。

主持人:真是太有意思了。所以我听下来,你的意思是:无论 AI 未来发展到什么程度,有一个始终会有价值的能力,就是 “理解软件的基本运作方式”——比如后端系统、数据库、CSS 等这些基本构件。

#04

应该培养的技能

主持人:那假设你有孩子(不管你现在有没有),如果他们来问你:“我该学些什么,未来才会过得好?” 你会怎么建议他们?你觉得他们应该学多少 “软件工程” 的内容才合适?

Guillermo Rauch:这个问题问得很好——我有五个孩子,我现在就已经开始 “亲自培养” 他们了(笑)。我在有意识地引导他们学习我认为未来特别有用的东西。

理解事物运作的方式,我认为是最宝贵的能力。这种理解力的基础是什么?我推他们特别用力去学数学。你要是数学不好,嘿嘿,不许住我家(笑)。说笑的啦,但我真的觉得数学是必须掌握的基本功。

还有一个是 “表达能力”。有个好玩的网络梗你听说过吗?叫 “词语型细胞 vs 形状型旋转者”(word cells vs shape rotators)。

“形状旋转者” 是指那种纯逻辑、纯数学脑子的人。你可以说,硅谷历史上的“王者”大多都是这类人,因为他们的工作往往代表着最高的地位、尊重、财富。

而 “词语型细胞” 则更擅长沟通、表达、具有人文学科的气质。

Apple 曾经展示过一张很棒的幻灯片,说他们站在 “人文艺术与科技的交汇处”。我一直对这两种 “脑子类型” 都非常尊重。

所以我觉得,培养表达能力、语言能力是非常重要的。你要能掌握我刚才说的那些 “符号”,能用正确的词去指代一个概念,构建起你头脑中的 “全球语言地图”——这会变得越来越有价值。

我们当然也有一些提示词优化工具,能帮助用户提升提示质量。但我想强调的是,提示优化不能替代真正的思考,也不能替代你注入到世界中的创造力。

V0 所做的一件事,就是努力默认生成美观的设计。我们在模型中融入了我们对 “什么是好设计” 的理解,指导它往那个方向生成。

但与此同时,我们也不希望整个互联网最终长得一模一样。所以,你能否用自己的语言去引导模型,告诉它你想参考什么风格、你想表达什么灵感,这将会变得非常关键。

我这里有个很棒的例子可以分享:昨晚我们在旧金山的 Vercel 总部举办了一场设计演示之夜,现场展示了我们是如何用 V0 构建 V0 和 Vercel 自身的。其中一个设计师展示了两段非常惊艳的动画。

其中一个,是一个三角形的动画效果,复杂到我一开始都没想到可以做出来——完全是用 V0 实现的。他用 “turbulence(扰动)” 这个词来描述他想要的那种视觉感觉。

我特意提这个词,就是想提醒大家:知道这个词和不知道这个词,结果可能是天壤之别。正是因为他用了这个词,才生成出了那个美到令人惊叹的、可交互的三角形动画——很有可能你在不久的将来就会在某个网页上看到它了。

所以我认为,表达能力、语言能力会变得极其重要。我希望我的孩子们都能掌握它。

我还做了一件事,就是带我孩子去参加黑客马拉松。我们刚去了一个很棒的黑客马拉松,是在旧金山大学(USF)举办的,叫 Bloom Hackathon。我带了两个孩子一起去。

我就是想看看大家是怎么展示自己作品的。我们玩得很开心,还吃了华夫饼和烤三明治——额外的加分项(笑)。

在我看来,“展示” 和 “把自己展示给世界” 是非常重要的技能。

我一开始在播客里也提到过,我其实从你和你的嘉宾身上学到了很多,因为你会把一些很棒的内容片段发在 X(原推特)上,分享视频和访谈节选。

所以,能把你做的东西展示出来、分享出去,这是未来非常关键的技能,尤其是在一个 “边际成本几乎为零” 的世界里——软件和新产品的生产门槛越来越低。

你必须学会打造自己的 “观众”。你必须学会如何与人交流。你必须建立你自己的“风格”和“品牌标识”。

当然,也许我的孩子们现在还太小,还不太懂这些。但我想,带他们参加黑客马拉松这件事,已经在潜移默化地影响他们的 “神经网络”,为将来的训练数据打下基础(笑)。

主持人:他们以后一定会跟同学说:“我爸带我去黑客马拉松了。” 别人都一脸震惊(笑)。那你真的是在鼓励他们学编程吗?因为我注意到你前面提到数学、表达、展示这些技能,那编程呢?

Guillermo Rauch:我会让他们学一些,但我的重点是——让他们学会怎么 “使用提示词”、怎么用 V0 编程。我们在构建东西的时候,会展示生成的代码,这样他们就可以逐渐建立起 “输入提示词” 和 “输出代码” 之间的映射。

也就是说,他们不一定要抽象地去学 “什么是编程”,除非他们本身对这个很感兴趣。我的五个孩子性格各异,兴趣也完全不同,我也不想强迫他们去做他们不喜欢的事情。

所以学不学编程,这件事因人而异,有些人会喜欢,有些人可能觉得那太无聊了。

但我推荐大家至少去理解一下这些东西是怎么运作的。比如你给 V0 或其他工具下一个提示词,生成出一段代码,那你至少要大概知道它做了什么。这个过程,其实是 “表达能力” 的一种延伸。

我在 Vercel 很早期就做过一个决定,后来被证明非常正确。我们可以把 Vercel 当作是 “简化版的 AWS”。

我们拥有一大批用户群体,这些人如果自己去配置云服务中的各种细节,可能根本搞不定。但他们又确实需要像 AWS 那样的扩展能力、灵活性、速度等等,因为他们想打造真正高质量的产品和服务。

我喜欢用超级碗的例子来说明这一点:我们的一位客户叫 Ramp,他们在超级碗期间投放了一支广告,网站流量瞬间暴涨了 43 倍。

而负责这个项目的工程师,只需要学会 Next.js 就够了——这是我们开发的框架。他把代码推送到 Vercel,然后就能触达上亿用户,系统依然 100% 正常运行,没有任何崩溃或延迟。

这种 “超级能力” 来自于一件事:我们把 “入门门槛” 降到了极致。而我们选择的编程语言——JavaScript——在这个故事中也非常关键。

在我看来,JavaScript 就像是 “编程语言里的英语”。

你只要学会了它,就能覆盖全球数十亿的设备。所以并不奇怪,当你让 ChatGPT、Anthropic 或 Gemini 去生成一个 Web 应用时,它们最终都会选择 JavaScript、React,这些已经成了 Web 开发的 “通用语言”。

所以如果你真的想深入学习编程,那就从 JavaScript 开始吧。因为它可以让你接触到海量用户。

如果你有兴趣深耕工程领域,我认为未来几十年甚至上百年内,都会有一个 “核心技能” 始终保持价值,那就是:构建 “基础性基础设施”。

你可以把 LLM 理解为一种 “神谕者”(oracle),它们可以帮你生成软件,但它们还是有很多限制的。

比如上下文窗口、计算资源等等。现在的 AI 代理还很难做到从零开始写一个 “完整的云平台”,写出所有基础服务,自己从头造一个框架、编译器。它们并不是在“重新创造宇宙”,而是基于已有的技术生态在运行。

否则就会陷入牛顿那句经典名言:“想要从头开始做一个苹果派,你必须先创造宇宙。”

换句话说,大模型是在与现有的世界协作,而不是从无到有。所以那些掌握 “底层基础设施构建能力” 的工程师,在未来仍然会极具竞争力。

主持人:我们也听到过一种说法:或许未来某一天,ChatGPT 会自己生成下一个版本的 ChatGPT。但你刚才的意思是——如果真的会实现,那也还早着呢,对吧?

Guillermo Rauch:完全同意。要不然你去看这些 AI 公司官网的招聘页面,全是 “招聘工程师”、“招聘工程师”——几乎所有岗位都是工程岗(笑)。

当然,也有例外。比如在 Vercel,我们本来有 150 位能写代码的工程师,总人数是 600。但现在,你可以说我们有 “600 位工程师”。

为什么?因为我看到的最棒的一些 V0 应用,根本不是技术团队做出来的,而是市场团队、销售团队、产品团队做的!

产品团队,没错——现在他们真的可以 “亲自构建产品” 了!

就在昨晚,我看到我们在 V0 上写了一份新功能的产品文档,关于如何把 V0 项目部署到 Vercel——可以把它看作是一个 “实时在线的产品需求文档”(Live PRD)。其中的细节丰富到令人震惊!

我们大家看完都说:“这还能不直接上线?这不就是完整产品了?”

它是可视化的、可交互的,展示了出错状态、成功状态、加载缓慢状态……一应俱全。

它不仅赋能了有技术背景的人,更赋能了产品构建者去拓展自己的思路——甚至包括那些他们原本都没考虑过的产品状态和细节。

#05

V0 前景

主持人:V0 这个名字听起来像是 “V1 的前一版”,给人的感觉是它是一个用来做原型、初版尝试的工具。现在很多 AI 工具确实也都在这个方向找到了产品市场契合点——用来做原型、MVP、演示稿,把想法变成可以“跑起来”的东西。

那你觉得 V0 或其他类似工具,未来是否能发展到构建像 Salesforce 那样的大型企业级应用,甚至支撑数十亿美元的业务?

Guillermo Rauch:其实我们已经有一个企业级客户,他们的全部产品、全部功能、所有客户沟通内容,全部都是基于 V0 构建的。

就在两天前,有人在 X 上跟我讲了一个有趣的故事。他说他的兄弟刚刚把用 V0 做的网站卖给了第一个客户——这是他们第一次真正靠 V0 实现了商业变现。

昨天我在一次投资人大会上,有位投资人走过来对我说:“我有两个朋友刚刚在 V0 上订婚了。” 我说:“等等……V0 现在成婚恋平台了吗?”原来他们是用 V0 做了订婚网站、求婚网站、甚至婚礼页面,全是 V0 原生构建的!

我们之所以能支持这些 “从头到尾” 的使用场景,是因为我们把 V0 和 Vercel 的基础架构做了深度集成。

所以我前面讲的那个故事——“我有个网站要上线,我希望它能被一亿人看到”——现在对所有人都成立了。我们可以让每个人都拥有这种能力。

从前端到后端、从原型到产品,完全 V0 原生构建,运行在强大而灵活的无服务器架构上,支持亿级访问量——你只需要输入提示词,或者上传截图,甚至直接把产品需求文档粘贴进去就行了。

#06

真实案例

主持人:那我们来帮大家提升一下使用 V0 的成功率吧,等等也可以做个演示。

但在此之前,假设你可以“悄悄坐在一个第一次使用 V0 的人旁边”,对着他耳边说一句建议,让他更容易成功使用这个工具,你会说什么?有没有什么特别的使用小技巧?

Guillermo Rauch:首先,我会说:你可以尽可能大胆地设想你想要构建的东西,然后大胆地告诉这个工具。

如果你能提供一些 “灵感参考”,你得到的结果通常会更好。

如果你实在不知道要做什么、要怎么写提示词,那我建议你可以先去 V0 社区看看,挑一个项目分叉一下当起点。

还有一个建议特别适合有技术背景的人:保持 “暂时的怀疑中止”(suspension of disbelief)。

就像我之前说的,V0 的代码生成让我很震惊——比如它生成的代码在可访问性方面比我写得还好。所以你需要保持开放心态:这个工具可能真的知道一些你不知道的东西。

所以,与其去纠结它用不用了某个框架或写法,不如把注意力更多放在产品描述本身——你希望最终用户体验到什么?你希望这个产品做什么?

用开放的心态去引导它试试。还有一点是:你要有 “迭代意识”。

你可以把它想象成你在和一家设计公司合作,或者你雇了一家外包开发团队。你一定会来来回回交流很多次,对吧?你会说“换个试试”、“再想个版本”……

而这恰恰就是我在 V0 上经常做的事情。很多时候我只是随口说一句:“换一个版本吧”,它就能把我卡住的地方顺利解决掉。

主持人:你是直接就用 “换一个版本” 当提示词吗?

Guillermo Rauch:也不一定非得这么说,就是在对话框里随便说点人话:“V0,我们得聊聊了,这个不太行啊……” 就像你在做一次一对一的绩效评估(笑):“兄弟,咱得换个方案。”

我自己现在也把这当作一种 “寻找突破点” 的训练。我一直在试图找到 V0 做不到的东西。我在 V0 社区也有自己的个人主页,到时候可以把链接发给大家。上面有六七个我自己亲手做的项目,我觉得都挺有代表性的。

比如说,有一次我从东京飞回旧金山,飞机上的网络特别差。我在飞行过程中有个习惯,就是喜欢随时监控自己所乘坐的航班。我通常会打开 FlightRadar 或类似的工具。

那次飞行实在太无聊了,我发现那些航班追踪网站,不知道是 FlightRadar 还是其他几个,我有好几个 app,它们界面都特别臃肿,不符合我心中理想的样子。

所以我决定:那就自己做一个吧!就在飞机上,我用世界上最差的网络连接,直接做了一个我自己的航班雷达应用。

我调用了一个叫 AviationStack 的航班数据 API,然后告诉 V0:“我们要来做一款地球上最棒的航班雷达。”

我没有具体告诉它怎么做。它自己选用了一个叫 Mapbox 的地图工具,以及一个叫 Leaflet 的 JavaScript 库。这些都不是我指定的。

你知道接下来发生了什么吗?

我们先做出了一个初版设计,而且非常漂亮。然后我开始更进一步地要求:“现在我们来让它变成真的吧。”

说实话,这就是我一贯的工作方式,也是 Vercel 当初的开发流程——我们总是从用户体验出发,从界面开始构建。

我先让飞机图标能在屏幕上跑起来,接下来再处理更复杂的细节。比如:你知道吗?天空中同时存在的航班数量非常多,多到一个屏幕根本显示不下。

所以我开始和 V0 一起优化性能。但我依然没有给它具体的技术实现方式。我只是说:“我们现在飞机太多了,得想办法搞定它。”

我还开玩笑地称呼它为 “chief”,比如:“chief,我们得想想办法了。”

后来我把这个项目分享到 X 上,很多工程师看了之后都震惊了——因为它最终生成了一个基于 Canvas 的渲染方案。

Canvas 是那种像 Figma 这样高级产品才会用到的底层渲染技术。而 V0 不但做到了,还在地图上叠加了一个超强的可视化层,能在任意时刻渲染上万架飞机。

然后我继续跟它说:“好吧,现在我们让它变成一个全栈应用吧,把它接上航班 API。”

这个例子说明了一点:整个过程中,我们并没有设限。它能一直构建下去,没有天花板。

而我自己现在在 V0 社区中扮演的角色之一,就是不断尝试 “挑战极限”——看看它有没有什么做不到的。

哪怕它能做出来,我们也会非常关注质量和性能。我们的目标始终是:这些东西必须是真实可用的。这是我们对用户的承诺。

主持人:那你做这个航班雷达花了多少钱?用了多少时间?

Guillermo Rauch:你说这个航班雷达项目?大概不到两个小时吧——而且是在世界上最烂的网络环境下做的。对不起日本航空,我还是很爱你们的(笑),但你们的 Wi-Fi 真不行。

主持人:那成本呢?比如你用了 V0 付费版,大概花了多少钱?你估计一下?

Guillermo Rauch:我用的是 V0 的 $20 月费套餐。

主持人:也就是说,你只用了两个小时,成本大概就 20 美元?但如果让工程师来做,要花多少时间?多少钱?

Guillermo Rauch:要是让工程师做?少说几周,毫无疑问。

主持人:那至少得几万美元吧?

Guillermo Rauch:差不多。也许你能找到一个 “超级能干” 的工程师,不用 AI,纯手写代码,两三天能做出来。但别忘了:那设计谁来做?而我本人又成了瓶颈——我是工程师。

而这也正是这种“人机协作”的神奇之处。我是产品经理,我给它提供产品方向,比如说:“在两个机场之间画一条虚线。”

然后 V0 居然回答我说:“我需要考虑地球的曲率,所以得画一条伪正弦路径。”

我当时的反应是:“好吧,V0 你真是个超天才。”

所以我才说,这个工具简直就像一个 “产品副驾驶”,它是个 “全知的存在”。

我们昨天还有一位用户提交了正面反馈。他非常满意,说:“V0 就像是一个超级聪明、但有点注意力缺陷的五岁博士。”

我不是想把它神化,说它什么都完美、什么都能做,但它真的会时不时迸发出那种令人惊叹的聪明才智。

我一直认为,“AGI” 这个说法其实低估了我们现在这些工具的能力。我们已经拥有很多“超级智能的火花”。

我不认为 V0 是 AGI,但如果它能知道怎么根据地球曲率去画一条高性能的航线图,还能在地图上展示上万架飞机的实时位置……

那已经是超人级别了。而且——它真的很好用。

主持人:你在讲的时候我突然意识到,其实 AI 构建应用时代有三项核心技能:

  • 第一,知道 “该构建什么”
  • 第二,让它 “看起来好看”
  • 第三,让项目 “能走出卡壳状态”

Guillermo Rauch:没错。

主持人:而且很有意思的是,你刚刚讲的内容已经很像是 AI 工具的 “教练术” 了。比如你会说,“这里是数据库的问题”、“我们卡住了”、“这地方想不出来”……这些本来是工程师的责任,现在变成了人和 AI 之间的沟通过程。你认同这个观点吗?

Guillermo Rauch:完全认同。我可以讲个我自己的小故事。

我们回到很久以前。Next.js 是构建在 React 基础上的框架。React 是 Facebook 开发的 UI 组件库,它的初衷其实就是:让一大堆工程师能更高效地协作开发超大型产品。

于是他们发明(或者说推广)了“组件”这个概念,把它变成一种可复用的构建单元——就像“乐高积木”一样。你用组件来拼接页面。而语言模型特别喜欢 React 组件,这并不是巧合。

React 有个非常厉害的设计原则,就是所谓的 “逃逸口”(Escape Hatch):当你发现它的组件系统无法完美解决你的问题时,它会允许你跳出框架限制,自己决定下一步该怎么做。

比如说,它有个叫 dangerouslySetInnerHTML 的 API,专门让你“跳出安全边界”——告诉你,“你现在进入了未知领域,自己看着办吧。”

这个思路是一种非常深刻的系统设计理念。而我一直也在思考,“逃逸口” 这个概念可以怎么用在 V0 上。

V0 的一个强大 “逃逸口” 就是:你随时可以看到它生成的代码,而且可以自己编辑,也可以交给其他专家继续处理。

我们昨天在演示时展示了一个案例,是来自一家很棒的公司叫 Luma Labs。他们正在开发全球最先进的视频生成模型之一,他们在构建产品、网站时,大量使用了 V0。

他们的设计工程师讲述了一个例子:他说,他当时正在使用一个在 V0 上迭代了大约 120 次的项目。他已经深入“潜入了模型的潜意识空间”,完全沉浸其中了,结果遇到了卡壳。你知道他怎么做的吗?

他复制了我们生成的代码,贴到了 ChatGPT 里面,然后让 ChatGPT 帮他解题!

听到这个我真是太震惊了。我自己都没想到这个办法。这就呼应了你说的第三个点:“学会如何走出卡壳状态”,这简直是一个深刻的人生课题。

Facebook 以前有个原则叫 “Don\’t get blocked”(不要卡壳),意思是你要主动去找方法解决问题、找人帮忙。

现在厉害的是:你甚至可以 “找另一个 AI” 来帮你解卡。

我们还提供了其他 “逃逸口”——比如你可以看到它背后的源码,甚至把项目转成 Git 版本管理的形式,变成 “提示词驱动 + 传统工程”的混合项目。

而这个 “门” 是对你永远敞开的,这一点太重要了。

那我们来点实操吧,直接演示一下 V0 实际操作是怎样的。你来共享屏幕,我们边聊边看。一边展示,一边讲讲你的使用习惯。这个过程我觉得既直观又有趣——大家会更容易理解。

给TA打赏
共{{data.count}}人
人已打赏
AI新闻资讯

CVPR2025|MCA-Ctrl:多方协同注意力控制助力AIGC时代图像精准定制化

2025-5-12 15:00:08

AI新闻资讯

苹果发布FastVLM模型,可在iPhone上运行的极速视觉语言模型

2025-5-12 15:00:44

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
个人中心
购物车
优惠劵
今日签到
有新私信 私信列表
搜索