输入一句话,输出一套乐高设计!CMU 开源 LegoGPT AI 项目

卡内基梅隆大学研究团队发布一项创新性人工智能项目——LegoGPT,该模型可根据自然语言文本自动生成可拼搭的乐高积木设计。项目已在 GitHub 开源,用户可自由下载模型与数据集进行尝试和拓展。

输入一句话,输出一套乐高设计!CMU 开源 LegoGPT AI 项目

LegoGPT 由自回归大型语言模型驱动,训练数据包括超过47,000块乐高积木组成的28,000多个独特3D 对象。用户只需输入如“一个吉他造型”这样的文本提示,模型便能生成结构合理、可稳定搭建的乐高拼搭方案。

其核心亮点在于搭建过程中的“有效性检查”与“物理感知回滚”机制,确保生成的积木布局不会重叠或漂浮。同时,它也能生成可供人类或机器人按照说明搭建的结构化设计图,并附带文字注释。

研究团队还构建了名为 StableText2Lego 的训练数据集,利用 ShapeNetCore 网格和体素布局生成初始形状,再经过筛选与优化形成最终训练样本。未来,这项技术有望拓展为图像到乐高设计的完整流程,让用户通过上传照片获得创意拼搭方案。

地址:https://avalovelace1.github.io/LegoGPT/

给TA打赏
共{{data.count}}人
人已打赏
视频资讯

SurfSense:重新定义个人知识管理的AI研究助手

2025-5-12 11:30:35

教程文档

AI绘画-即梦3.0提示词示例之新品发布型​

2025-5-12 10:13:24

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
个人中心
购物车
优惠劵
今日签到
有新私信 私信列表
搜索