只有通过海量测试才能抓住泛化性的本质吗？

willai

本文第一作者为上海交通大学博士生程磊，指导老师为上海交通大学张拳石教授。

当以端到端黑盒训练为代表的深度学习深陷低效 Scaling Law 而无法自拔时，我们是否可以回到起点重看模型表征本身——究竟什么才是一个人工智能模型的「表征质量」或者「泛化性」？我们真的只有通过海量的测试数据才能抓住泛化性的本质吗？或者说，能否在数学上找到一个定理，直接从表征逻辑复杂度本身就给出一个对模型泛化性的先验的判断呢？

给TA打赏

共{{data.count}}人

人已打赏

AI 人工智能大模型模型训练

AI新闻资讯

人形机器人1：1复刻真人：技术执念、场景刚需，还是资本故事？——具身之路03期

2025-5-11 10:18:07

AI新闻资讯

机器人开始抢“主持人”饭碗！上海张江，傅利叶宣布下个十年规划，要做“以人为本的具身智能”

2025-5-11 15:03:07

0 条回复 A文章作者 M管理员

更换删除

暂无讨论，说说你的看法吧

1

如何使用即梦3.0模型？
5月12日
2

AI写作-DeepSeek虚拟伴侣指令之AI男友角色设定
5月9日
3

AI绘画-即梦ai智能参考功能实测
5月12日
4

豆包 1.5 · 深度思考模型上线边缘大模型网关可免费领百万Tokens
4月25日
5

AI变天！HeyGen发布“有灵魂”的数字人Avatar IV 一张照片秒变“戏精”数字人，表情比真人还细腻
5月8日
6

ICML 2025 | 视频生成模型无损加速两倍，秘诀竟然是「抓住attention的时空稀疏性」
5月9日

来自：

❯

个人中心

购物车

优惠劵

今日签到

有新私信私信列表

搜索

幸运之星正在降临...

点击领取今天的签到奖励！

恭喜！您今天获得了{{mission.data.mission.credit}}积分

今日签到

连续签到

{{item.credit}}

连续{{item.count}}天

查看所有

我的优惠劵

_￥_优惠劵

使用时效：无法使用

使用时效：
之前

使用时效：永久有效

优惠劵ID：
×

限制以下商品使用：限制以下商品分类使用：不限制使用：

[{{ct.name}}]

所有商品和商品类型均可使用

没有优惠劵可用!

购物车

×

删除

购物车空空如也!

清空购物车前往结算

您有新的私信

没有新私信

写新私信查看全部

{{userData.name}}已认证

人形机器人1：1复刻真人：技术执念、场景刚需，还是资本故事？——具身之路03期

机器人开始抢“主持人”饭碗！上海张江，傅利叶宣布下个十年规划，要做“以人为本的具身智能”