输入一句话，输出一套乐高设计!CMU 开源 LegoGPT AI 项目

视频资讯
5月12日
编辑

willai

卡内基梅隆大学研究团队发布一项创新性人工智能项目——LegoGPT，该模型可根据自然语言文本自动生成可拼搭的乐高积木设计。项目已在 GitHub 开源，用户可自由下载模型与数据集进行尝试和拓展。

输入一句话，输出一套乐高设计!CMU 开源 LegoGPT AI 项目

LegoGPT 由自回归大型语言模型驱动，训练数据包括超过47，000块乐高积木组成的28，000多个独特3D 对象。用户只需输入如“一个吉他造型”这样的文本提示，模型便能生成结构合理、可稳定搭建的乐高拼搭方案。

其核心亮点在于搭建过程中的“有效性检查”与“物理感知回滚”机制，确保生成的积木布局不会重叠或漂浮。同时，它也能生成可供人类或机器人按照说明搭建的结构化设计图，并附带文字注释。

研究团队还构建了名为 StableText2Lego 的训练数据集，利用 ShapeNetCore 网格和体素布局生成初始形状，再经过筛选与优化形成最终训练样本。未来，这项技术有望拓展为图像到乐高设计的完整流程，让用户通过上传照片获得创意拼搭方案。

地址：https://avalovelace1.github.io/LegoGPT/

给TA打赏

共{{data.count}}人

人已打赏

SurfSense:重新定义个人知识管理的AI研究助手

2025-5-12 11:30:35

字节跳动推出开源多模态模型BAGE 从图像生成到世界建模

2025-5-26 10:03:32

0 条回复 A文章作者 M管理员

更换删除

暂无讨论，说说你的看法吧

1

如何使用即梦3.0模型？
5月12日
2

AI写作-DeepSeek虚拟伴侣指令之AI男友角色设定
5月9日
3

AI绘画-即梦ai智能参考功能实测
5月12日
4

豆包 1.5 · 深度思考模型上线边缘大模型网关可免费领百万Tokens
4月25日
5

AI变天！HeyGen发布“有灵魂”的数字人Avatar IV 一张照片秒变“戏精”数字人，表情比真人还细腻
5月8日
6

ICML 2025 | 视频生成模型无损加速两倍，秘诀竟然是「抓住attention的时空稀疏性」
5月9日

来自：

❯

个人中心

购物车

优惠劵

今日签到

有新私信私信列表

搜索

幸运之星正在降临...

点击领取今天的签到奖励！

恭喜！您今天获得了{{mission.data.mission.credit}}积分

今日签到

连续签到

{{item.credit}}

连续{{item.count}}天

查看所有

我的优惠劵

_￥_优惠劵

使用时效：无法使用

使用时效：
之前

使用时效：永久有效

优惠劵ID：
×

限制以下商品使用：限制以下商品分类使用：不限制使用：

[{{ct.name}}]

所有商品和商品类型均可使用

没有优惠劵可用!

购物车

×

删除

购物车空空如也!

清空购物车前往结算

您有新的私信

没有新私信

写新私信查看全部