### [中国AI视频生成弯道超车：ByteDance和快手把美国对手甩在身后](https://www.willai.cc/article/172)

**Published:** 2026-05-17T20:40:00

**Author:** hiyoho

**Excerpt:** 生成式AI打了一年半，大家都盯着力大砖飞的文本模型，结果视频生成这个关键赛道，被中国团队悄咪咪做到了世界前列。金融时报刚出的报道说，开发者圈子里已经有人在私下认了：ByteDance和快手在视频生成上的进展，比美国同行快不止一步。 自家短视

生成式AI打了一年半，大家都盯着力大砖飞的文本模型，结果视频生成这个关键赛道，被中国团队悄咪咪做到了世界前列。金融时报刚出的报道说，开发者圈子里已经有人在私下认了：ByteDance和快手在视频生成上的进展，比美国同行快不止一步。

### 自家短视频库就是最好的训练场

这事说穿了也不复杂。ByteDance手里有TikTok，快手手里有快手短视频，两家加起来的用户生成内容，是任何美国AI实验室都拿不到的数据宝藏。你让Sora团队去哪搞几百亿条真人的、带标注的、多语言的短视频？ByteDance和快手不需要”去哪搞”，数据就在自家服务器上。

ByteDance推出的Seedance 2.0，快手的Kling 3.0，都是在这几百亿条视频的”喂养”下迭代出来的。美国实验室要训练视频生成模型，要么花钱买数据集（还不一定合法），要么自己拍（规模和多样性完全没法比）。中国这两家的优势，是天生的。

> “中国生成式AI团队已经在视频生成这个生成式AI的关键战场，走在了美国竞争对手前面。”——金融时报报道援引开发者评论

### 美国实验室不是没反应，是追起来费劲

OpenAI的Sora算是美国这边名头最响的视频生成模型，但一直没大规模开放。Google的Veo也在推，但进度和效果跟Seedance、Kling比，开发者群体里已经有不少人在转向中国模型了。不是说美国模型不好，是视频生成这个任务对数据量的依赖太强，而中国公司手里的数据，是美国公司 legally 拿不到的。

还有一个容易被忽略的点：中国短视频平台上的内容，天生就是”多模态”的——视频、音频、文字评论、用户互动，全套的。用这些数据训练出来的模型，生成出来的视频在语义连贯性、节奏感、甚至”网感”上，都比只用公开数据集训练的模型要自然得多。

### 这事的影响比看起来大

视频生成不是”能不能让AI画会动的画”这么简单。它是通向世界模型（World Model）的必经之路——你想让AI理解物理世界是怎么运转的，先得让它能生成符合物理规律的视频。中国团队在这个方向上领先，意味着它们在”让AI理解真实世界”这个更大规模的竞赛中，已经抢到了一个有利位置。

another angle是地缘AI竞争。美国一直在想办法限制中国拿到高端GPU，但数据这个维度，它是限制不了的。ByteDance和快手用自己的用户数据训练出来的模型，不需要英伟达最新款的卡也能迭代——当然有更好，但没有的话，靠数据和算法优化也能往前走。

* * *

这个报道出来后，估计又有一波”中国AI威胁论”要冒头。但站在开发者角度，哪家的模型好用、成本低、生成速度快，就用哪家的。视频生成这个赛道，目前是中国团队在领跑，美国实验室需要加快速度了。

📎 原文来源：[USA Daily Dose – Builders say Chinese AI labs lead US rivals in video era](https://usadailydose.com/2026/05/17/builders-say-chinese-language-ai-labs-lead-us-rivals-in-video-era-as-bytedance-and-kuaishou-practice-fashions-on-huge-short-form-video-libraries-from-their-very-own-apps-eleanor-olcott-monetary-inst/)（转引Financial Times报道，记者Eleanor Olcott）

**Tags:** AI, ByteDance, Kuaishou, 大模型, 视频生成

**Categories:** AI资讯

---